Aulas Estatistica Feg 2016

Unesp
Universidade Estadual Paulista
FACULDADE DE ENGENHARIA
CAMPUS DE GUARATINGUETÁ
MBA-PRO
ESTATÍSTICA
PARA A
TOMADA DE DECISÃO
Prof. Dr. Messias Borges Silva e Prof. M.Sc. Fabricio Maciel Gomes
GUARATINGUETÁ, SP – setembro de 2016

Prof. Dr. Messias Borges Silva
• Engenheiro Industrial Químico (EEL-USP-FAENQUIL)

• Certified Quality Engineer (American Society for Quality-USA)
• Pós-graduado em Ciências Térmicas (ITA)
• Pós-graduado em Qualidade (USJT)
• Mestre em Engenharia Mecânica (UNESP)
• Doutor em Engenharia Química (UNICAMP)
• Livre Docente em Engenharia da Qualidade (UNESP)
• Pós Doutorado pela Harvard University
• Esp. em Design of Experiments, Lean Enterprise, Lean Product
Development, Innovation&Design Thinking (Massachusetts Institute of
Technology-MIT-USA)
• Editor Chefe do livro Design of Experiments: Applications
• Pesquisador Visitante da Harvard University (HARVARD-USA)
• Professor da UNESP, USP e Ex-Diretor Geral da EEL-USP-FAENQUIL
• Coordenador do Curso de Pós-graduação em Engenharia da Qualidade da
EEL-USP
• Consultor de empresas
Prof. Dr. Fabrício Maciel Gomes
• Engenheiro Industrial Químico (EEL-USP)

• Mestre em Engenharia Química (EEL-US)
• Doutor em Engenharia de Produção (UNESP)
• Professor da Escola de Engenharia de Lorena – EEL/USP
• Professor da Faculdade de Engenharia de Guaratinguetá – FEG/UNESP
• Professor do Curso de Especialização em Engenharia da Qualidade –
EEL/USP
• Professor Convidado de MBA da UNESP e Instituto de Pós-graduação
IPOG
• Especialista em Monitoramento de Processos; Simulação e Otimização
de Processos.
• Ex- professor Titular da Universidade Paulista – UNIP.
• Ex-Professor do Centro Universitário Salesiano.
• Consultor de Empresas
2
Capítulo 1: Uma breve revisão de Estatística Descritiva
Fonte: Pedro Paulo Balestrassi (UNIFEI)
A essência da ciência é a observação. A ciência que se preocupa com a organização,

descrição, análise e interpretação dos dados experimentais é denominada de Estatística, um
ramo da Matemática Aplicada. A palavra estatística provêm de “Status”.
1.1 Grandes Áreas

O diagrama seguinte mostra o contexto em que se situa o estudo da Estatística, aqui
subdividido em Estatística Descritiva e Estatística Indutiva (ou Inferencial).
A Estatística Descritiva está relacionada com a organização e descrição de dados

associada a cálculos de médias, variâncias, estudo de gráficos, tabelas, etc. É a parte mais
conhecida. A Estatística Indutiva é o objetivo básico da ciência. A ela está associada,
Estimação de Parâmetros, Testes de Hipóteses, Modelamento, etc.
No Cálculo de Probabilidades, está a essência dos modelos Não-Determinísticos e
a corroboração de que toda inferência estatística está sujeita a erros.
A Amostragem é o ponto de partida (na prática) para todo um Estudo Estatístico.
Aqui pode se ter origem um problema bastante comum em Engenharia: “Análise profunda
sobre dados superficiais!
1.2 Medidas Estatísticas

As principais medidas estatísticas (ou simplesmente estatísticas) referem-se às
medidas de posição (locação ou tendência central) ou às medidas de dispersão (ou
variabilidade):
3
1.2.1 Medidas de Posição
Mostram o valor representativo em torno do qual os dados tendem a agrupar-se
com maior ou menor freqüência.
* Média Aritmética simples ( x )

n
x  x   x n
x i
i 1
x 1 2 
n n
Usada em dados não agrupados em classes.
* Média Aritmética ponderada (também x )

n
x p  x p    x n pn
x p i i
i 1
x 1 1 2 2  onde,
p1  p2    pn n
p i
i 1
pi = peso da amostra xi
Agora, para dados agrupados em classes, temos:

n
x i ni
1 n n
x
i 1
n   x i ni   x i f i
n i
n i 1 i 1
i 1
A média aritmética simples pode ser vista como a média ponderada com todos os
pesos iguais. Para efeito de nomenclatura sempre trataremos a média aritmética simples ou
ponderada simplesmente por média ( x ).
* Mediana ( ~
x)
É o valor “do meio” de um conjunto de dados, quando os dados estão dispostos em

ordem crescente ou decrescente.
Para dados não agrupados em classes:
 n  1
o
x 
Se n é ímpar  ~  termo
 2 
4
n n 
o o
  termo    1 termo
2 2 
Se n é par  ~
x
2
Ex.:
35, 36, 37, 38, 40, 40, 41, 43 ,46  x~  40
12, 14, 14, 15, 16, 16, 17, 20  x~  15 2 16  15,5

* Média  Mediana
A média é muito sensível a valores extremos de um conjunto de observações,

enquanto a mediana não sofre muito com a presença de alguns valores muito altos ou
muito baixos. A mediana é mais “robusta” do que a média.
Devemos preferir a mediana como medida sintetizadora quando o histograma do
conjunto de valores é assimétrico, isto é, quando há predominância de valores elevados em
uma das caudas.
Ex.: { 200, 250, 250, 300, 450, 460, 510 }
x  345,7 x~  300
Tanto x como ~
x são boas medidas de posição.
Ex.: { 200, 250, 250, 300, 450, 460, 2300 }
x = 601 ~
x = 300
Devido ao valor 2300, ~

x é preferível a x .
* A Média Aparada
É obtida eliminando do conjunto as m maiores e as m menores observações.

Geralmente, 2,5%  m  5% dos dados. Esta eliminação corresponde, na realidade, à
supressão dos valores extremos - muito altos ou muito baixos. Tal média representa um
valor entre x e ~
x.
Ex.: {200, 250, 250, 300, 450, 460, 2300}
250  250  300  450  460

x (m  1)   342
5
* A moda e a classe modal (mo)
5
É o valor que representa a maior freqüência em um conjunto de observações
individuais. Para dados agrupados temos a classe modal. Em alguns casos pode haver mais
de uma moda. Assim temos uma distribuição bimodal, trimodal, etc.
Ex.:
 x
mo
X xi ni
10 |— 20 15 2
20 |— 30 25 4
30 |— 40 35 10  Classe Modal
40 |— 50 45 6
50 |— 60 55 2
Distribuição
Bimodal
mo I mo II x
Obs.: A moda geralmente não é fornecida em calculadoras.
1.2.2 Medidas de Dispersão ou Variabilidade

Quase nunca uma única medida é suficiente para descrever de modo satisfatório um
conjunto de dados. Torna-se então necessário estabelecer medidas que indiquem o grau de
dispersão em relação ao valor central.
Nos seguintes conjuntos de dados, por exemplo:
A = { 3, 4, 5, 6, 7 }
B = { 1, 3, 5, 7, 9 }
C = { 5, 5, 5, 5 }
D = { 3, 5, 5, 7 }
E = { 3.5, 5, 6.5 }
6
Temos em todos eles a mesma média. A identificação de cada um desses conjuntos
de dados pela sua média nada informa sobre as diferentes variabilidades dos mesmas.
Algumas medidas que sintetizam essa variabilidade são:
* Amplitude (R):
Como anteriormente definida, R tem o inconveniente de levar em conta somente os dois

valores extremos, o maior e o menor deles.
* Desvio Médio (DM(x)), Variância (S2,Var(X) ou 2) e Desvio Padrão (S,DP(X)

ou ):
Aqui o princípio básico é analisar os desvios das observações em relação à média

das observações.
Em A = {3, 4, 5, 6, 7}, por exemplo, os desvios xi - x são: -2, -1, 0, 1, 2. É fácil ver
que a soma dos desvios, é identicamente nula e que portanto não serve como medida de
dispersão:
n n n
 (x
i 1
1  x )   x1   x  n x  n x  0
i 1 i 1
Duas opções para analisar os desvios das observações são:
a) considerar o total dos desvios em valor absoluto ou;

b) considerar o total dos quadrados dos desvios.
Assim, para o conjunto A, teríamos, respectivamente:
 xi  x  2  1  0  1  2  6 e
i 1
 x  x  4  1  0  1  4  10
2
i
i 1
Associando estas medidas à média, temos:

n
 xi  x
i 1
DM(x)= que é o desvio médio.
n
n
 x  x
2
i
= i 1
S2 que é a variância ( Var(x))
n
7
Sendo a variância uma medida que expressa um desvio quadrático médio, é
conveniente usar uma medida que expresse a mesma unidade dos dados originais. Tal
medida é o desvio padrão S (ou DP(x)), dada por:
S  S2
O uso do DM(x) pode causar dificuldades quando comparamos conjuntos de dados

com número diferentes de observações.
Ex.:
Em A = { 3, 4, 5, 6, 7 } temos:
DM(x) = 6/5 = 1.2 e

S2 = 10/5 = 2
Em D = { 3, 5, 5, 7 } temos:
DM(x) = 1,0 e
S2 = 2,0
Assim, podemos dizer que, segundo o Desvio Médio, o Grupo D é mais homogêneo
(tem menor dispersão) do que A, enquanto que ambos tem a mesma homogeneidade
segundo a variância. O desvio médio possui pequena utilização em estatística e em geral
vale 0.8 vezes o desvio padrão
O cálculo do desvio padrão exige o cálculo prévio da variância e uma fórmula

alternativa para S2 é dada por:
n n
 x  x x
2 2
i i
i 1 i 1
S2    x2
n n
Relacionados à inferência estatística, alguns autores usam (n - 1) como divisor para

a variância:
n
 x  x
2
i
i 1
S2  , e isto será visto adiante (tendenciosidade).
n1
Obs.: Muitas calculadoras científicas possuem duas medidas para desvio padrão. Uma
associada à divisão por n (simbolizada geralmente por  ou n) e outra associada à divisão
por n - 1 (simbolizada geralmente por S ou n-1). Verifique a simbologia usada pela sua
calculadora, caso você possua uma!
Para dados agrupados em classes, a variância é dada por:
8
K
  x  x
2
i  ni K
i 1
  x  x
2
S 
2
ou S 2  i  fi
n i 1
É intuitivamente claro que a multiplicação de cada parcela (xi - x )2 por ni significa

a repetição dos desvios quadrados (xi - x )2, ni vezes.
1.3 Histogramas
Fonte: Messias Borges Silva
Os dados obtidos de uma amostra servem como base para a decisão sobre uma
população. Quanto maior for o tamanho da amostra maior será a informação sobre a
população.
Mas à medida que aumenta o tamanho da amostra fica difícil o entendimento da
população, se estes dados estiverem dispostos apenas em uma tabela.
Para facilitar então o entendimento, construímos o histograma, que permitirá
entender a população de forma objetiva.
1.3.1 Como construir Histogramas
a) Construção da Tabela de Freqüências.
Exemplo: A Tabela 1 mostra as medidas de pH de 90 amostras de uma solução ácida.

Construir o histograma desses dados.
9
Tabela 1. Medidas de pH de 90 amostras de solução ácida
Nº pH medido
amostra
1 – 10 2,510 2,517 2,522 2,522 2,510 2,511 2,519 2,532 2,543 2,525
11 – 20 2,527 2,536 2,506 2,541 2,512 2,515 2,521 2,536 2,529 2,524
21 – 30 2,529 2,523 2,523 2,523 2,519 2,528 2,543 2,538 2,518 2,534
31 – 40 2,520 2,514 2,512 2,534 2,526 2,530 2,532 2,526 2,523 2,520
41 – 50 2,535 2,523 2,526 2,525 2,532 2,522 2,502 2,530 2,522 2,514
51 – 60 2,533 2,510 2,542 2,524 2,530 2,521 2,522 2,535 2,540 2,528
61 – 70 2,525 2,515 2,520 2,519 2,526 2,527 2,522 2,542 2,540 2,528
71 – 80 2,531 2,545 2,524 2,522 2,520 2,519 2,519 2,529 2,522 2,513
81 – 90 2,518 2,527 2,511 2,519 2,531 2,527 2,529 2,528 2,519 2,521
10
Máximo Mínimo
Nº pH medido Valor Valor da
amostra
Linha Linha
1 – 10 2,510 2,517 2,522 2,522 2,510 2,511 2,519 2,532 2,543 2,525 2,543 2,510
11 – 20 2,527 2,536 2,506 2,541 2,512 2,515 2,521 2,536 2,529 2,524 2,541 2,506
21 – 30 2,529 2,523 2,523 2,523 2,519 2,528 2,543 2,538 2,518 2,534 2,543 2,518
31 – 40 2,520 2,514 2,512 2,534 2,526 2,530 2,532 2,526 2,523 2,520 2,534 2,512
41 – 50 2,535 2,523 2,526 2,525 2,532 2,522 2,502 2,530 2,522 2,514 2,535 2,502
51 – 60 2,533 2,510 2,542 2,524 2,530 2,521 2,522 2,535 2,540 2,528 2,542 2,510
61 – 70 2,525 2,515 2,520 2,519 2,526 2,527 2,522 2,542 2,540 2,528 2,542 2,515
71 – 80 2,531 2,545 2,524 2,522 2,520 2,519 2,519 2,529 2,522 2,513 2,485 2,513
81 – 90 2,518 2,527 2,511 2,519 2,531 2,527 2,529 2,528 2,519 2,521 2,531 2,511
Maior Menor
Valor Valor
2,545 2,502
11
Passo 1: Calcular a Amplitude de R.
R = Maior valor – Menor valor
R = 2,545 - 2.502
R = 0,043
Passo 2: Determinação dos intervalos de classe:
No exemplo: 0,043 + 0,002 = 21,5 22 intervalos

0,043 + 0,005 = 8,6 9 intervalos
0,043 + 0,01 = 4,3 4 intervalos
Portanto o intervalo de classe determinado é 0,005
Passo 3 : Preparação da tabela de freqüência

Nesta tabela teremos as classes, ponto médio, nº de observações, freqüência, etc.
12
Passo 4: Determinação dos Extremos de cada classe.
Primeiro determine o menor valor da 1ª classe e adicione o valor calculado do
intervalo de classe(no exemplo 0,005). Então o intervalo da 1ª classe fica entre
2,5005 e 2,5055 de forma que a classe inclui o menor valor 2,502. O intervalo da
2ª classe fica entre 2,5055 e 2,5105 e assim por diante.
Registrar esses intervalos na tabela.
Passo 5: Cálculo do ponto médio da classe.
Ponto médio = Soma do valor superior e inferior da classe

2
Ponto médio 1ª classe = 2,5005 + 2,5055 = 2,503

2
Ponto médio 2ª classe = 2,5055 + 2,5105 = 2,508

2
Passo 6: Obtenção da Freqüência

Verificar os valores observados dentro dos intervalos registrando o número de
vezes em que este valor apareceu.
Registrar os valores na tabela (vide tabela anterior).
1.3.2 Como construir graficamente o Histograma
Passo 1: Numa tabela quadrada, marcar no eixo vertical do lado esquerdo, a freqüência de
observações e do lado direito a porcentagem. No eixo horizontal os intervalos de classes.
Passo 2: Em cada intervalo de classe, levantar um retângulo (barra) correspondente à

freqüência de classes.
Passo 3: Nos espaços em branco, registrar dados informativos: tamanho de amostra, média,
desvio padrão.
13
14
1.3.3 Tipos de Histogramas
a) Geral (simétrico) b) Combinado (Multi-modal)
c) Positivamente desviado d) Precipício à esquerda
e) Platô f) 2 Picos (Bimodal)
15
g) Pico Isolado
1.3.4 Interpretação do Histograma
a) Geral (simétrico): O valor médio do histograma está enquadrado no centro da amplitude

dos dados. A freqüência é maior no centro e torna-se gradualmente menor à medida que nos
aproximamos dos extremos. Obs. Este tipo é o que aparece na maior parte dos casos.
b) Combinado (multi-modal): Muitas classes possuem uma freqüência baixa. Obs. Este
tipo ocorre quando o número de unidades de dados incluídos nas classes varia de classe ou
quando existe uma tendência particular em função do arredondamento dos dados.
c) Positivamente Desviada (Negativamente Desviada): O valor médio histograma está

localizado do lado esquerdo (direito) do centro da amplitude. A freqüência diminui um
tanto abruptamente em direção ao lado esquerdo (direito). É assimétrica.
d) Precipício à esquerda (Precipício à direita): O valor médio de histograma está

localizado longe do lado esquerda (direito) do centro da amplitude. A freqüência diminui
abruptamente do lado esquerdo e brandamente segue em direção ao lado direito (esquerdo).
É assimétrica. Obs. Este tipo ocorre frequentemente quando 100% da classificação é feita
com dados de processo de baixa capabilidade.
e) Platô: A freqüência em cada classe forma um platô pelo fato das classes possuirem mais
ou menos a mesma freqüência exceto para aqueles que estão no final. Obs. Este tipo ocorre
com mistura de diversas distribuições possuindo valores diferentes de médias.
f) Dois Picos (Bimodal): A freqüência é baixa no centro da amplitude dos dados e existe
um pico de cada lado. Obs. Este tipo ocorre quando duas distribuições com diferentes
valores de médias são misturados.
g) Pico Isolado: Existe um pequeno pico isolado em adição ao tipo geral. Obs. Este caso
aparece quando existem pequenas inclusões de dados oriundos de diferentes distribuições,
16
como no caso de anormalidade no processo, erro de medida ou inclusão de dados oriundos
de diferentes processos.
1.3.5 Comparando Histogramas com Limites de Especificação
Se existe uma especificação devemos levantar linhas dos limites superior e inferior
de especificação (LSE) e (LIE) no histograma para comparar a distribuição com a
especificação. A partir daí verificar se o histograma está bem localizado dentro dos limites.
Casos típicos:
1) Histograma satisfaz as especificações
a)
Manter a presente situação, desde que o histograma satisfaça amplamente as especificações.
b)
A especificação é satisfeita, mas não há margem de segurança. Portanto, é melhor reduzir a

variação.
17
2) Histograma não satisfaz as especificações
c) É necessário tomar as medidas para trazer a média para o centro da especificação.
d) Este requer ação para reduzir a variação.
e) Tomar as medidas descritas em c e d.
18
2. Distribuições de Probabilidade
O histograma é usado para apresentar dados amostrais (Amostra = conjunto de

observações extra das de uma população).
Por exemplo, 50 valores de satisfação dos clientes são interpretados como uma
amostra da satisfação de todos os clientes.
O uso de métodos estatísticos permite que se analise essa amostra e se tire alguma
conclusão sobre a satisfação dos clientes.
Uma distribuição de probabilidade é um modelo matemático que relaciona um certo
valor da variável em estudo com a sua probabilidade de ocorrência.
Há dois tipos de distribuição de probabilidade.
 Distribuições Contínuas: Quando a variável que está sendo medida é expressa em

uma escala contínua, como por exemplo, o peso de peças produzidas, diâmetro, etc.
 Distribuições Discretas: Quando a variável que está sendo medida só pode assumir
certos valores, como por exemplo, os valores inteiros 0, 1, 2, etc.
No caso de distribuições discretas, a probabilidade que a variável X assuma um valor

específico X0 é dada por:
P {X = X0} = P(X0)
No caso de variáveis contínuas, as probabilidades são especificadas em termos de

intervalos:
Pa  X  b
Relembrando: uma variável aleatória é uma função com valores numéricos, cujos valores
são determinados por fatores de chance.
 Uma variável aleatória é considerada discreta se toma valores que podem ser
contados.
 Uma variável aleatória é considerada contínua quando pode tomar qualquer valor
em determinado intervalo.
Os gráficos a seguir apresentam exemplos de distribuições de probabilidades

discreta e contínua.
19
Exemplo: Distribuição de probabilidade para a variável aleatória “número de caras em duas
jogadas de uma moeda”.
Resultado Número de Prob. do

Número de Prob. do
caras Resultado
caras Resultado
Valor da
Valor da
VA
VA
cara – cara 2 ½x½=¼
2 ¼
cara – coroa 1 ½x½=¼
1 ¼+¼=½
coroa – cara 1 ½x½=¼
0 ¼
coroa - coroa 0 ½x½=¼
Soma =1
Soma =1
O valor esperado, ou esperança matemática, de uma variável aleatória é E(x), que

consiste no valor esperado para ela, ou seja, o valor médio da variável.
n
E ( X )   pi  X i sendo X a V.A. discreta
i 1
ou

E( X )   X  f  X   dX

sendo X a V.A. contínua
E a variância de X é dada por: Var(X) = E(X2) – [E(X)]2
O desvio padrão é: Var(X)
No Exemplo o valor esperado é:
0  1  1 1  2  1  1
4 2 4
20
A variância:
 4 2 4

Var ( X )  0 2  1  12  1  2 2  1  12  0,5
O desvio padrão:
  0,5  0,71
2.1. Distribuições Discretas mais Importantes
As principais distribuições discretas são a Distribuição de Bernoulli, Distribuição

Binomial e Distribuição de Poisson.
9.1.1. Distribuição de Bernoulli
A distribuição de Bernoulli consiste em uma distribuição adequada à variável

aleatória de Bernoulli, que por sua vez é uma v.a. que assume apenas os valores 0 e 1, com
função de probabilidade tal que:
P (0 )  P ( x  0 )  1  p
P (1)  P ( X  1)  p
Então, E ( X )  p e Var ( X )  p  1 p
9.1.2. Distribuição Binomial
Seja um processo composto de uma seqüência de observações independentes, onde

o resultado de cada observação pode ser um sucesso ou uma falha.
Se a probabilidade de sucesso é constante e igual a p, a distribuição do número de
sucessos seguirá o modelo Binomial.
A distribuição Binomial é usada com freqüência no controle de qualidade. É o
modelo apropriado quando a amostragem é feita sobre uma população infinita ou muito
grande.
A distribuição binomial possui quatro propriedades essenciais:
1. As observações possíveis podem ser obtidas através de dois diferentes métodos de

amostragem. Cada observação pode ser considerada como se tivesse sido
selecionada a partir de uma população infinita sem reposição ou a partir de uma
população finita com reposição.
2. Cada observação pode ser classificada em uma de duas categorias mutuamente
excludentes e coletivamente exaustivas, usualmente chamadas sucesso ou falha.
3. A probabilidade de uma observação ser classificada como sucesso (p) é constante de
observação para observação. Assim sendo, a probabilidade de fracasso 1-p também
é constante.
21
4. O resultado (isto é, sucesso ou fracasso) de qualquer observação independe do
resultado de qualquer outra observação.
Em aplicações de controle da qualidade, X em geral representa o número de defeituosos

observados em uma amostra de n itens.
n  n 
P ( X )     p X  1  p 
n X n!
e   
X  X  X !(n  X )!
n 
onde:   representa o número de combinações de n objetos tomados X de cada vez.
X
P(X) = probabilidade de X sucessos uma vez que n e p são conhecidos.

n = tamanho da amostra.
p = probabilidade de sucesso  1-p = probabilidade de falha
X = número de sucessos na amostra (X = 0, 1, 2, ..., n)
A média de uma variável aleatória com distribuição binomial é:
  np
E a variância é dada por:
 2  n  p  1 p 
X
onde p é a proporção de sucessos na amostra p 
n
Exemplo: Um processo industrial opera com média de 1% de defeituosos. Baseado em

amostras de 100 unidades, calcule as probabilidades de uma amostra apresentar 0, 1, 2, 3 e
4 defeituosos. Plote a distribuição de probabilidade correspondente.
100 
  0,010  1  0,01
100 0
P ( X  0)    0,366
 0 
100 
  0,011  1  0,01
100 1
P ( X  1)    0,370
 1 
100 
  0,012  1  0,01
100 2
P ( X  2)    0,185
 2 
22
100 
  0,013  1  0,01
100 3
P ( X  3)    0,061
 3 
100 
  0,014  1  0,01
100  4
P ( X  4)    0,015
 4 
9.1.3. Distribuição de Poisson
A aplicação típica da distribuição de Poisson no controle da qualidade é como um

modelo para o número de defeitos (não-conformidades) que ocorre por unidade de produto
(por m2, por volume ou por tempo).
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos
numa área de oportunidade – um intervalo contínuo (de tempo, de comprimento, de área,
...) de maneira tal que, se encurtarmos a área de oportunidade ou intervalo suficientemente:
1. A probabilidade de se observar exatamente um sucesso no intervalo é estável.

2. A probabilidade de se observar mais de um sucesso no intervalo é zero.
3. A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente
da ocorrência em qualquer outro intervalo.
A distribuição de Poisson tem um parâmetro  (lambda) que é a média ou o número

esperado de sucessos por unidade. A variância desta distribuição é 2 = . O número de
sucessos X da variável aleatória de Poisson varia de 0 a .
A expressão matemática para a distribuição de Poisson para se obterem X sucessos,
dado que  sucessos são esperados é:
e    X
P( X )  onde X = 0, 1, 2, ...
X!
onde:
P(X) = probabilidade de X sucessos, dado o conhecimento de .
 = número esperado de sucessos.
e = constante matemática (aproximadamente 2,71828)
23
X = número de sucessos por unidade.
Exemplo: Suponha que o número de defeitos no cordão de solda de uma carroceria siga
uma distribuição de Poisson com  = 2. Então a probabilidade de uma carroceria apresentar
mais de 3 defeitos será:
P( X  3)  1 P( X  3)  1 PX  0  PX  1  PX  2  P X  3
e 2  20
P ( X  0)   0,135
0!
e 2  21
P ( X  1)   0,271
1!
e 2  22
P ( X  2)   0,271
2!
e 2  23
P ( X  3)   0,180
3!
P ( X  3)  1  [0,135  0,271  0,271  0,180]  0,143  14,3%
Exemplo 2: Se chegam em média 2 carros por minuto em um posto de gasolina, qual a

probabilidade de que cheguem exatamente 5 carros em dois minutos?
Neste caso o tempo é diferente do tempo correspondente ao . Então deve-se transformar o

 para que ele corresponda ao tempo de 2 minutos. Chegam em média 2 carros por minuto,
portanto chegam em média 4 carros em 2 minutos   = 4.
e 4  25
P ( X  5)   0,0,1563  15,63%
5!
2.2. Distribuições Contínuas
A distribuição mais importante e mais utilizada na prática é a Distribuição Normal.

Outros modelos importantes de distribuições contínuas são: Uniforme, Exponencial, Gama,
Qui-Quadrado, t de Student e F de Snedecor.
9.2.1. Distribuição Normal
A Distribuição Normal é essencialmente importante na estatística por três razões

principais:
24
1. Inúmeros fenômenos contínuos parecem seguí-la ou podem ser aproximados por
meio dela.
2. Podemos utilizá-la para aproximar várias distribuições de probabilidade discretas.
3. Ela oferece a base para a inferência estatística clássica, devido à sua afinidade com
o teorema do limite central.
Os parâmetros da distribuição Normal são a média e o desvio padrão. Trata-se de

uma distribuição simétrica, unimodal, em forma de sino.
A função de probabilidade da distribuição normal é dada por:
2
1  X  
1   
2  
f(X)  e
  2
onde:
e = constante matemática (aproximada por 2,71828).
 = constante matemática (aproximada por 3,14159).
µ = média aritmética da população.
 = desvio padrão da população.
X = qualquer valor da variável aleatória contínua onde - ≤ X  .
25
Para simplificar a notação de uma v.a.c. com distribuição normal, com média µ e
variância 2 utiliza-se:
X ~ N (, 2)
A distribuição Normal acumulada é obtida calculando a probabilidade de X ser

menor que um dado valor a.
a
P( X  a)  F (a)   f ( X )dX  função de densidade açumulada

Essa integral não pode ser resolvida em forma fechada, mas a solução está
apresentada em tabelas onde se entra com a variável reduzida ou variável padronizada Z e
encontra-se F(Z) ou vice-versa.
 a
P ( X  a)  P  Z    F( X )
  
Valor Tabelado (Procurar na tabela da distribuição Normal padronizada)
Exemplo: O peso de um produto é uma característica muito importante. Sabe-se que o peso
segue um modelo normal com média de 1000 gramas e desvio padrão 40 gramas. Se a
especificação técnica estabelece que o peso deve ser maior que 950 gramas, qual a
probabilidade de que um pacote selecionado aleatoriamente satisfaça a especificação?
 950  1000 
P ( X  950)  P  Z    P (Z  1,25)  0,3944  0,5  0,8944  89,44%
 40 
A probabilidade de que um pacote selecionado aleatoriamente satisfaça a especificação é de

89,44%.
Exemplo 2: Sabe-se que X representa medições feitas em um processo que segue o modelo
Normal com média de 100 e desvio padrão 10. Se forem feitas 4000 medições, quantas
estarão entre 95 e 112?
26
 95  100 112  100 
P (95  X  112)  P  Z 
 10 10 
P (95  X  112)  P ( 0,5  Z  0,2)
P (95  X  112)  0,1915  0,3849
P (95  X  112)  0,5764  57,64%
Se forem feitas 4000 medições, aproximadamente 2305 estarão entre 95 e 112. (4000 x
57,64%)
3. Teoria Elementar da Amostragem
A teoria da amostragem é o estudo das relações existentes entre uma população e as

amostras dela extraídas. É muito utilizada para a estimação das grandezas desconhecidas da
população (parâmetros) através de conhecimento das grandezas correspondentes nas
amostras (estatísticas amostrais).
A teoria da amostragem é também útil para determinar se as diferenças observadas
entre duas amostras são devidas a uma variação casual ou são verdadeiramente
significativas.
Por exemplo: queremos testar se os tempos de processamento da matéria prima de
dois sistemas de produção são diferentes ou não. A resposta a esta questão implica o uso de
testes de hipótese, que será visto mais adiante.
Denomina-se inferência estatística a inferência de parâmetros (da população) com
base nos resultados obtidos na amostra.
Para que as conclusões sejam válidas, é necessário que a amostra selecionada seja
representativa da população. Para isso podem ser utilizados os métodos de amostragem
probabilísticos apresentados no capítulo 1: aleatória, sistemática, estratificada ou por
conglomerados. O método mais utilizado é o por amostragem aleatória.
3.1. Amostragem Com e Sem Reposição
Quando selecionamos uma amostra devemos analisar se esta amostragem é com ou

sem reposição. Na amostragem com reposição o mesmo elemento pode ser escolhido mais
de uma vez. Na amostragem sem reposição cada elemento só pode ser selecionado uma
única vez.
Exemplo: uma urna contém dez bolas, numeradas de 0 a 9. Retira-se a primeira bola, anota-
se o número, 3 por exemplo, e não se recoloca a bola na urna. Os outros números que
podem ser sorteados são 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema é o sistema sem reposição.
Entretanto, se tivéssemos recolocado a bola 3 na urna, então todos os números poderiam
ser selecionados na segunda extração, inclusive o 3. Este sistema é chamado sistema com
reposição.
27
Em geral, quando uma amostragem é sem reposição, dizemos que a população é
finita.
Quando uma amostragem é com reposição, então dizemos que a população é
infinita, pois a população nunca será exaurida. Para fins práticos a amostragem de uma
população finita muito grande pode ser considerada infinita.
3.2. Distribuições Amostrais
Consideremos todas as amostras possíveis de tamanho n que podem ser retiradas de

uma população dada (com ou sem reposição). Para cada amostra podemos calcular uma
grandeza estatística, por exemplo, a média. Deste modo obtemos a distribuição amostral da
média. Da mesma forma podemos calcular a distribuição amostral do desvio padrão, da
variância, das proporções, ...
3.2.1. Distribuição Amostral das Médias
Uma distribuição amostral de médias é uma distribuição de probabilidade que indica

quão prováveis são diversas médias amostrais. A distribuição é função da média, do desvio
padrão da população e do tamanho da amostra. Para cada combinação da média, desvio
padrão e tamanho da amostra haverá uma única distribuição amostral de médias.
Sejam:
 X = média da população = µ
 X = média da distribuição amostral.
 X = desvio padrão da população = 
 X = desvio padrão da distribuição amostral.
N = tamanho da população.
n = tamanho da amostra.
Admita-se que todas as amostras possíveis de tamanho n sejam retiradas de uma

população finita de tamanho N > n. Então:
 N n
População finita:  X   e  X  
n N 1
Se a população for infinita, ou se amostragem for tomada com reposição, os

resultados serão:

População infinita:  X   e  X 
n
28
A fórmula do desvio padrão nos diz que a quantidade de dispersão na distribuição
amostral depende de dois fatores:
 a dispersão da população
 o tamanho da amostra (utilizando raiz quadrada)
Por exemplo, em qualquer população, o aumento do tamanho das amostras extraídas

resultará em menor variabilidade entre as possíveis médias amostrais. E se o mesmo
tamanho de amostra é usado com diferentes populações, as populações com maior
quantidade de dispersão  X tenderão a gerar maior quantidade de variabilidade entre as
médias de amostras extra das delas.
Para amostras grandes n> 30 a distribuição amostral das médias é aproximadamente
normal, com média  X e desvio padrão  X , independente da população, desde que a
variância e a média da população sejam finitas e o tamanho da população seja, no mínimo,
o dobro da amostra. Este resultado para população infinita é um caso especial do Teorema
do Limite Central da teoria avançada de probabilidade, que mostra que a precisão da
aproximação melhora quando n cresce. Isto é indicado, algumas vezes, dizendo-se que a
população é assintoticamente normal. No caso da população ser normalmente distribuída, a
distribuição amostral das médias também o será, mesmo para pequenos valores de n (n<
30).
Teorema do Limite Central
1. Se a população sob amostragem tem distribuição normal, a distribuição das médias

amostrais também será normal para todos os tamanhos de amostra.
2. Se a população básica é não normal, a distribuição de médias amostrais será
aproximadamente normal para grandes amostras.
Exemplo: Calcule o desvio padrão da distribuição amostral de médias onde o desvio padrão
da distribuição populacional é 2 e o tamanho da amostra é 40.
X 2
X    0,3162
n 40
Determine a média das distribuições de médias amostrais, sendo que a média populacional
é 678.
 X   X  678
Exemplo 2: A média de uma distribuição amostral de médias é 50 e seu desvio padrão é 10

(desvio padrão da distribuição amostral das médias). Suponha normal a distribuição
amostral. Que percentagem das médias amostrais estará entre 45 e 55?
29
O procedimento é análogo ao visto no capítulo referente à distribuição normal, entretanto
deve-se utilizar o valor de  X = 50 e  X =10.
Então: P 45   X  55  0,3830  38,30%
Exemplo 3: Um fabricante de baterias alega que seu artigo de primeira categoria tem uma
vida esperada (média) de 50 meses. Sabe-se que o desvio padrão correspondente é de 4
meses. Que percentagem de amostras de 36 observações acusará vida média no intervalo de
1 mês em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida média das
baterias?
Sabemos que, como n> 30, a distribuição das médias amostrais será aproximadamente
normal com média igual à média populacional e desvio padrão igual ao desvio padrão
populacional dividido pela raiz quadrada do tamanho da amostra. Além disso, vamos
pressupor população infinita, pois a produção de baterias não termina (teoricamente!).
A solução envolve a determinação do número de desvios padrões que 49 e 51 distam da

média (amostral).
Determinemos primeiro o desvio padrão da distribuição amostral:
X 4
X    0,67 para n = 36.
n 36
Então devemos trabalhar com X ~ N 50;0,67 
 
P 49  X  51  Z 
XX
X

49  50
0,67
 1,5
30
 
P 51  X  50  Z 
XX
X

51  50
0,67
 1,5
 
P 49  X  51  P ( 1,5  Z  1,5)  0,4332  0,4332  0,8664  86,64%
Então o percentual de amostras que apresentará problemas entre 49 e 51 meses é de 87%.
3.2.2. Distribuição Amostral das Proporções
Sendo a probabilidade de ocorrência de um evento p (sucesso) e a probabilidade de

não ocorrência 1-p (fracasso).
Consideram-se todas as amostras possíveis de tamanho n de uma população infinita
e, para cada amostra, determina-se a proporção de sucessos. Assim obtém-se a distribuição
amostral das proporções.
A média da distribuição amostral é sempre igual à proporção p = p onde:
p = proporção populacional.
p = média da distribuição amostral das proporções.
Quando a população é muito grande ou infinita, o desvio padrão da distribuição

amostral se calcula:
p  1  p 
p 
n
e pode-se fazer uma aproximação para a distribuição normal quando n> 30.
Exemplo: Determine a média da distribuição de proporções amostrais, quando a proporção

na população é 72,3%
p  p  72,3%
Exemplo 2: Determine o desvio padrão da distribuição amostral de proporções para n=100

e uma proporção populacional de 60%.
p  1  p 0,6  1  0,6
p    0,049
n 100
Exemplo 3: Verificou-se que 2% das ferramentas produzidas por uma certa máquina são
defeituosas. Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3%
ou mais revelarem-se defeituosas?
31
p  1  p 0,02  1  0,02
p  p  2% e  p    0,007
n 400
Como n> 30 pode-se utilizar a distribuição normal, então:
 0,03  0,02 
P p  0,03  P  Z    P Z  1,43  0,07636  7,34%
 0,007 
4. Estimação
A estimação é o processo que consiste em utilizar dados amostrais para estimar

parâmetros populacionais.
As estatísticas amostrais são utilizadas como estimadores de parâmetros
populacionais.
Assim, uma média amostral é usada como estimativa da média populacional, a
proporção de defeituosos de uma caixa é utilizada para estimar a proporção de defeituosos
na produção toda, etc.
Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma
única estimativa do parâmetro. Em virtude da variabilidade amostral, é usual incluir uma
“estimativa intervalar” para acompanhar a estimativa pontual. Esta nova estimativa
proporciona um intervalo, ou âmbito, de possíveis valores do parâmetro populacional.
Estimativa pontual: estimativa única de um parâmetro populacional

Estimativa intervalar: intervalo de valores possíveis, o qual se admite que esteja contendo
o parâmetro.
Um intervalo de confiança dá um intervalo de valores, centrado na estatística

amostral, no qual julgamos, com um risco conhecido de erro, estar o parâmetro da
população.
Exemplos:
Parâmetro Tipo de Estimativa

Populacional Pontual Intervalar
Média Um carro de motor 1.0 anda, em Um carro de motor 1.0 anda, em
média, 14 km com um litro de média, entre 12 e 16 km com 1 litro
combustível. de combustível.
Proporção A proporção de peças defeituosas é A proporção de peças defeituosas

de 2%. está entre 1,5 % e 2,5 %.
Desvio O desvio padrão da temperatura O desvio padrão da temperatura

Padrão numa piscina não aquecida é da numa piscina não aquecida está
32
ordem de 2º C. entre 1º C e 3º C.
Os intervalos de confiança podem ser unilaterais (por exemplo, a proporção de

defeitos é maior de 3%) ou bilaterais (a proporção de defeitos está entre 2% e 4%).
A capacidade de estimar parâmetros populacionais por meio de dados amostrais está
ligada diretamente ao conhecimento da distribuição amostral da estatística que está sendo
usada como estimador.
Os intervalos de confiança para os parâmetros são construídos de forma que se
considera uma variação em torno do valor amostral e, assim, pode-se escrever que o
parâmetro situa-se entre dois limites:
Valor do parâmetro = estimativa pontual ± erro de amostragem
O erro de amostragem depende da distribuição amostral do parâmetro, do nível de

confiança adotado e do tamanho da amostra.
A tabela a seguir apresentada resume as informações necessárias para intervalos de
confiança.
População
Infinita Finita
Estimativa de médias:
Pontual X X
Intervalar
 X conhecido X X N n
X Z X Z 
n n n 1
 X desconhecido SX SX N n
X t X t 
n n N 1
Estimativa das Proporções:

Pontual X X
p p
n n
Intervalar p  1  p  p  1  p N  n
p p 
n n N 1
Onde:
Z representa o valor tabelado da distribuição Normal, com nível de confiança .
33
t representa o valor tabelado da distribuição t de Student, com nível de confiança  e GL
graus de liberdade.
N é o tamanho da população.
n é o tamanho da amostra.
Exemplo: Intervalo de confiança para a média µ quando se conhece a variância de

população  X . Seja uma amostra de tamanho 36 de uma população infinita, sabe-se que
 X = 3 e X = 24,2.
Confiança Z Fórmula Cálculo E Intervalo

desejada (tabelado)
90% 1,65 X 3 24,2  0,825 23,375 a 25,025
X Z 24,2  1,65
n 36
95% 1,96 X 3 24,2  0,980 23,220 a 25,180

X Z 24,2  1,96
n 36
99% 2,58 X 3 24,2  1,290 23,110 a 25,690

X Z 24,2  2,58
n 36
4.1. Tamanho da Amostra
Uma das perguntas mais freqüentes em estatística é: “Qual o tamanho da amostra

que devemos tomar?”.
O tamanho da amostra dependerá do grau de confiança desejado (Z), da quantidade
de dispersão entre os valores individuais (  X ), e de certa quantidade específica de erro
tolerável (e).
“O tamanho da amostra que você afinal selecionará dependerá de seu orçamento,
da importância econômica das decisões e da variabilidade na população. Desses três
problemas, dois são de ordem gerencial, cabendo a você a decisão; apenas o terceiro
(variabilidade) está fora do seu controle.” (Brenda Landy).
A fórmula do erro pode ser resolvida em relação a n. Assim, para o caso de
estimação de médias, tem-se:
X X   
2
eZ  n Z  n  Z  X 
n e  e 
E para estimação de proporções:
34
p  1  p  p  1  p  
2
 Z 2  p  (1  p)
eZ  e 2  Z    n 
n  n  e2
Exemplo: Que tamanho de amostra será necessário para produzir um intervalo de 90% de
confiança para a verdadeira média da população, com erro de 1,0 em qualquer dos sentidos,
se o desvio padrão da população é 10?
Sabemos que  X = 10 e e = 1 e queremos um intervalo 90% de confiança para a média,

o que implica utilizar um valor de Z = 1,65.
  
2 2
 10 
n   Z  X   n  1,65    272,25  tamanho da amostra 273
 e   1
Exemplo 2: As companhias de seguro estão ficando preocupadas com o fato de que o

número crescente de telefones celulares resulte em maior número de colisões de carros.
Estão, por isso, pensando em cobrar prêmios mais elevados para os motoristas que utilizam
celulares. Desejamos estimar, com uma margem de erro de três pontos percentuais, a
percentagem de motoristas que falam ao celular enquanto dirigem. Supondo que se
pretende um nível de confiança de 95% nos resultados, quantos motoristas devem ser
investigados? Suponha que não tenhamos nenhuma informação sobre p.
Z 2  p  (1  p) 1,96 2  0,5  1  0,5

n  n   1067,11  tamanho da amostra 1068
e2 0,03 2
5. Teste de Hipóteses
Os testes de hipóteses são também conhecidos como testes de significância.

A finalidade dos testes de hipóteses é avaliar afirmações sobre os valores de
parâmetros populacionais.
Os testes de hipóteses e a estimação são dois ramos principais da inferência
estatística.
Enquanto o objetivo da estimação é estimar algum parâmetro populacional, o
objetivo dos testes de hipóteses é decidir se determinada afirmação sobre um parâmetro
populacional é verdadeira. Por exemplo, podemos querer determinar se são verdadeiras as
afirmações:
 o tempo médio de realização do teste é 80 minutos.

 três por cento da população (de determinado item) é defeituosa.
 os percentuais de não conformes dos dois processos são iguais.
Utilizam-se duas hipóteses, sendo chamadas de hipótese nula (H0) e hipótese alternativa
(H1).
35
A hipótese nula H0 é uma afirmação que diz que o parâmetro populacional é tal
como especificado (isto é, a afirmação é verdadeira).
A hipótese alternativa H1 é uma afirmação que oferece uma alternativa à alegação
(isto é, o parâmetro é maior, ou menor, que o valor alegado).
Exemplo: O estudo de uma amostra de tamanho 55 peças indicou que o diâmetro médio é
de 27,5 mm. Então:
 H0: o diâmetro médio da população (de peças) é 27,5 mm.

 H1: o diâmetro médio da população (de peças) é diferente de 27,5 mm.
Os testes de hipótese utilizam a significância adotada pelo pesquisador. A

significância é a probabilidade de uma hipótese nula ser rejeitada, quando verdadeira. Que
coincide com o erro tipo 1.
Ao testar uma hipótese, há dois tipos de erros que podemos cometer:
  = P {rejeitar H0/H0 é verdadeira} = erro do tipo 1.

  = P {aceitar H0/H0 é falsa} = erro do tipo 2.
O procedimento usual é fixar o valor de  e verificar o valor de . O risco  é uma

função do tamanho da amostra, e é controlado indiretamente. Quanto maior o tamanho da
amostra, menor será o risco .
Se H0 é
Verdadeira Falsa
Aceitar H0 Decisão Correta Erro Tipo 2 ()
Ação
Rejeitar H0 Erro Tipo 1 () Decisão Correta
Basicamente os testes de hipótese envolvem as seguintes etapas:
1. Estabelecer as hipóteses nula e alternativa;

2. Identificar a distribuição amostral adequada;
3. Escolher um nível de significância (e assim os valores críticos);
4. Calcular a estatística do teste e compará-la com os valores críticos;
5. Rejeitar a hipótese de nulidade se a estatística do teste excede o(s) valor(es)
crítico(s); caso contrário, aceitá-la.
Os testes de hipótese podem ser unilaterais ou bilaterais. Nos testes unilaterais a

hipótese alternativa H1 é do tipo µ > 33 ou µ < 33, por exemplo. Nos testes bilaterais a
hipótese alternativa é do tipo µ  33. A hipótese nula permanece igual nos dois casos. A
área de rejeição é dividida quando o teste é bilateral.
36
5.1. Teste de Hipóteses para Médias
5.1.1. X Conhecido
Quando se conhece o desvio padrão da população, a distribuição amostral adequada

é a distribuição normal. Se a população é normal, a distribuição amostral será normal para
todos os tamanhos de amostra. Se a população é não normal, ou se sua forma é
desconhecida, pode-se usar um teste de uma amostra só para tamanhos de amostras
superiores a 30 observações. Assim, pequenas amostras de população não normais não
podem ser tratadas por este processo.
Suponha que X é uma variável aleatória com média µ desconhecida e variância  X2
conhecida. E queremos testar a hipótese de que a média é igual a um certo valor
especificado µ0. O teste de hipótese pode ser formulado como segue:
H0 : µ = µ0
H1 : µ  µ0
Para testar a hipótese, toma-se uma amostra aleatória de n observações e calcula-se a

estatística:
Exemplo: Uma máquina de usinagem deveria produzir entalhes com 0,85 mm de

profundidade. O engenheiro desconfia que os entalhes que estão sendo produzidos são
diferentes que o especificado. Uma amostra de 8 valores foi coletada e indicou X = 0,847.
Sabendo que o desvio padrão é  = 0,010, teste a hipótese do engenheiro usando um nível
de significância  = 0,05.
H0: µ = 0,850;
H1: µ  0,850.
0,847  0,850
Z teste   0,85
0,010
8
Como Zteste = -0,85 > - Z0,025 = - 1,96. H0 não pode ser rejeitada.
Conclusão: não podemos afirmar que os entalhes sejam diferentes que o especificado, ao
nível de significância de 0,05.
37
5.1.2. X Desconhecido
Quando não se conhece o desvio padrão da população, deve-se estimá-lo a partir dos
dados amostrais usando o desvio padrão amostral. Quando isso ocorre (na maioria das
situações reais  X é desconhecido), a distribuição t é a distribuição amostral adequada.
Suponha que X é uma variável aleatória Normal com média µ e variância  2
desconhecidas. Para testar a hipótese de que a média é igual a um valor especificado µ o.
formulamos:
H0: µ = µ0
H1: µ  µ0
Esse problema é idêntico àquele da seção anterior, exceto que agora a variância é
desconhecida.
Como  X não é conhecido, usa-se a distribuição de Student para construir a
estatística do teste:
X 
t teste 
SX
n
E a hipótese nula H0 é rejeitada se [tteste] > t/2, onde t/2, n-1 é um valor limite da
distribuição de Student tal que a probabilidade de se obter valores externos a t/2 é .
5.2 Testes de Duas Amostras para Médias
Os testes de duas amostras são usados para decidir se as médias de duas populações
são iguais. Exigem-se amostras independentes, ou seja, uma de cada população. Eles são
freqüentemente utilizados para comparar dois métodos de ensino, duas cidades, duas
marcas, duas fábricas, ....
OBS: dados provenientes de antes-depois são dependentes, não podendo, portanto, serem
tratados por este método.
5.2.1. X Conhecido
Quando há duas populações com médias desconhecidas, digamos µa e µb e desvios

padrões conhecidos,  a e  b , o teste para verificar a hipótese que as médias sejam iguais é
o seguinte:
H0: 1 = 2
H1: 1  2
38
X1  X 2
Z teste 
 12  22

n1 n2
E rejeita-se H0 se [Zteste] > Z/2
5.2.2. X Desconhecido
Similarmente, quando,  a e  b , não são conhecidos, o teste para verificar a

hipótese que as médias sejam iguais é:
X1  X 2
t teste 
S12 S 22

n1 n 2
E rejeita-se H0 se [tteste] > t/2, n1+n2-2
5.3. Teste para Proporções
Este tipo de teste é apropriado quando os dados sob análise consistem de contagem
ou freqüências de itens em duas ou mais classes. A finalidade de tal teste é avaliar
afirmações sobre a proporção (ou percentagem) de uma população. O teste se baseia na
premissa de que uma proporção amostral será igual à verdadeira proporção populacional, a
menos da variabilidade amostral. O teste foca na diferença entre o número esperado de
ocorrências (supondo-se verdadeira uma afirmação) e o número efetivamente observado. A
diferença é então comparada com a variabilidade prescrita por uma distribuição amostral
baseada na hipótese de que H0 é realmente verdadeira.
Quando a finalidade da amostragem é julgar a validade de uma alegação acerca de
uma proporção populacional, é apropriado o teste para proporções. Onde:
H0: p = p0
H1: p  p0
O valor da estatística de teste é dado por:
X  p0
Z teste  n
p0  1  p 
n
e deve ser comparada com o valor cr tico de Z (retirado de uma tabela da distribuição
normal)
39
Exemplo: Um fabricante afirma que uma remessa de pregos contém menos de 1% de
defeituosos. Uma amostra aleatória de 200 pregos acusa 4 defeituosos. Teste a afirmação ao
nível 0,01.
H0: p = 1%
H1: p > 1%  pois desejamos evitar a aceitação de uma remessa com
mais de 1% de defeituosos, mas nada há contra aceitar o fato da
remessa apresentar qualidade superior à acordada.
X  p0 4  0,01
Z teste  n  200  1,42
p0  1  p  0,01 1  0,01
n 200
Na tabela da distribuição normal, Z0,01 = 2,33.

Aceita-se H0, e pode-se dizer que a quantidade de pregos defeituosos é 1% ou menos, ao
nível de significância 0,01.
5.4. Teste do Qui-Quadrado (k amostras para proporções)
A finalidade de um teste de k amostras é avaliar se as proporções de k amostras

independentes provenham de populações que contenham a mesma proporção de
determinado item. Conseqüentemente, tem-se:
H0: As proporções populacionais são todas iguais

H1: As proporções populacionais não são iguais
Ou seja, estamos testando se as duas variáveis são ou não associadas, por exemplo,
se queremos testar se a proporção de mulheres e de homens que trabalham no horário
noturno em uma fábrica são iguais, automaticamente estaremos testando se sexo e turno de
trabalho são variáveis associadas.
Este teste baseia-se na distribuição qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A decisão de aceitar ou rejeitar H0 dependerá da
comparação deste valor com o valor tabelado da distribuição qui-quadrado.
Por exemplo, tem-se a distribuição de peças produzidas por turno e se essas peças
são boas ou apresentam algum tipo de defeito. No turno da manhã foram produzidas 967
peças, onde 183 apresentaram algum tipo de defeito.
Turno de Produção
Total
Manhã Tarde Noite
Peças com algum defeito 183 30 11 224
Peças boas 784 264 308 1356
Total 967 294 319 1580
40
O teste baseia-se na pressuposição que, se as duas variáveis fossem independentes,
então o valor esperado de cada célula poderia ser encontrado fazendo-se:
(total da linha)  total da coluna 

Frequência Esperada 
total geral
Freqüências Esperadas
Turno de Produção
Total
Manhã Tarde Noite
Peças com algum defeito 137,1 41,7 45,2 224
Peças boas 829,9 252,3 273,8 1356
Total 967 294 319 1580
224  967
Frequência Esperada   137,1
1580
teste de independência qui-quadrado é obtido utilizando-se a estatística:
 
2 O  E 2
E
Se o valor obtido for maior que o valor crítico obtido na tabela 2 então diz-se que
as variáveis NÃO são independentes. Se o valor encontrado for menor, então diz-se que as
variáveis são independentes.
O valor dos GRAUS DE LIBERDADE é obtido através do cálculo:
graus de liberdade = (colunas-1)(linhas-1)
No exemplo apresentado:
2 
183  137,12  30  41,72  ...  308  273,82  51,88
137,1 41,7 273,8
e o valor crítico encontrado na tabela para (2-1) x (3-1) = 2 graus de liberdade e nível de
significância 0,05 é 5,991.
Tem-se valor calculado > valor tabelado então diz-se que as variáveis NÃO são
independentes. OU SEJA, a proporção de peças boas produzidas depende do turno de
41
trabalho. A proporção de peças boas no turno da manhã é 81%, na tarde 90% e na noite
97%.
42
Capítulo 2: Projeto de Experimentos
Projeto de Experimentos (DOE, Design of Experiments), ferramenta que vem
sendo utilizada para verificar o funcionamento de sistemas ou processos produtivos,
permitindo melhoria destes, redução na variabilidade, e conformidade próxima do
resultado desejado, além de redução no tempo de processo e, consequentemente, nos
custos operacionais.
Podemos, brevemente, citar alguns benefícios do DOE:
 Larga aplicação em todas as áreas;

 Mostra as variáveis mais importantes do processo;
 Permite otimização;
 Requer menor número de experimentos que os métodos convencionais;
 Maior controle dos processos;
 Redução significante dos custos;
 Redução no tempo de desenvolvimento de um produto;
 Redução na variabilidade dos produtos e maior aproximação com os requisitos
exigidos pelos clientes;
As etapas do DOE são divididas em:
 Planejamento;
 Execução dos experimentos;
 Análise dos dados;
 Experimento de confirmação;
 Conclusão.
2.1 Definições
43
Experimento: Um conjunto planejado de operações com o objetivo de
descobrir novos fatos ou confirmar ou negar resultados de investigações anteriores.
Fator: (Variável independente) Um “fator” é uma das variáveis controladas ou
não, que exercem influência sobre a resposta que está sendo estudada no experimento. Um
fator pode ser quantitativo, isto é, a temperatura em graus, o tempo em segundos. Um fator
pode, também, por exemplo, ser qualitativo, ter diferentes máquinas, diferentes operadores,
interruptor ligado ou desligado, catalisador A ou B.
Nível: Os “Níveis” de um fator são os valores do fator examinado no
experimento. Para os fatores quantitativos, cada valor escolhido constituiu um nível, isto é,
se o experimento deve ser conduzido em quatro temperaturas diferentes, então o fator
“temperatura” possuiu quatro “níveis”. No caso dos fatores qualitativos, “o interruptor
ligado ou desligado” representa dois níveis para o fator interruptor; caso estejam sendo
utilizadas seis máquinas por três operadores, então o fator “máquina” tem seis níveis,
enquanto o fator “operador” tem três níveis.
Tratamento: Um “Tratamento” é um nível atribuído a um fator único durante
um experimento, por exemplo, a temperatura a 800 graus. Uma “combinação de
tratamento” é o conjunto de níveis para todos os fatores num dado experimento. Por
exemplo, um experimento utilizando temperatura de 800 graus, máquina 3, operador A, e
interruptor desligado constituir-se-ia numa combinação de tratamento.
Unidades Experimentais: As “Unidades Experimentais” consistem em
objetos, materiais ou unidades aos quais se aplicam os tratamentos. Podem ser entidades
biológicas, materiais naturais, produtos manufaturados etc.
Ambiente Experimental: O “Ambiente Experimental” compreende as
condições ambientais que podem vir a influenciar os resultados do experimento de modo
conhecido ou desconhecido.
Delineamento de Experimento: O plano formal para a condução do
experimento é chamado “delineamento de experimento” ou “modelo experimental”. Ele
inclui a escolha de respostas, fatores, níveis, blocos e tratamentos, além da utilização de
determinadas ferramentas chamadas agrupamento planejado, aleatorização e replicação.
Aleatorização: A seqüência de experimentos e/ou a atribuição de amostras a
diferentes combinações de tratamento de maneira puramente casual é denominada
44
“Aleatorização”. Tal atribuição aumenta a probabilidade de que o feito de variáveis
incontroláveis seja eliminado.
Também aprimora a validade das estimativas da variância dos erros
experimentais e torna possível a aplicação de testes estatístico de significância, além de
construção de intervalos de confiança. Sempre que possível, a aleatorização deve fazer
parte do experimento.
Replicação: A “Replicação” é a repetição de uma observação ou medição de
forma a aumentar a precisão ou fornecer os meios para medir a precisão. Uma replicação
única consiste de uma única observação ou realização do experimento. Proporciona uma
oportunidade para que se eliminem os efeitos de fatores incontroláveis ou de fatores
desconhecidos pelo experimentador e assim, com a aleatorização, atua como ferramenta
diminuidora de tendências. A replicação também ajuda a detectar erros graves nas
medições. Nas replicações de grupos de experimentos, diferentes aleatorização devem ser
aplicadas a cada grupo.
2.2 Experimentos Fatoriais (convencionais)
No passado, na realização de experimentos que envolviam mais de um fator, e

cada fator com mais de um nível, adotava-se o seguinte procedimento:
Escolhia-se um fator, o qual era experimentado variando o seu nível, enquanto
os outros fatores tinham seus níveis fixados. Terminada a experimentação com o primeiro
fator escolhido, assumia-se para o mesmo o melhor valor desejado (máximo, mínimo, etc) e
repetia-se o procedimento com os outros fatores, um de cada vez.
Este processo não leva em consideração as eventuais interações existentes entre
os fatores.
Para tentar suprir esta lacuna foram usados os Experimentos Fatoriais, que
passamos a detalhar.
2.2.1 Experimentos Fatoriais com K Fatores (cada fator com dois níveis)
Os delineamentos fatoriais 2k possuem ampla aplicação industrial. Tais

delineamentos permitem a avaliação em separado dos efeitos individuais e dos efeitos de
45
interação dos fatores num experimento no qual todos os fatores variam simultaneamente
num padrão de tentativas cuidadosamente organizado.
Um experimento fatorial com fatores, cada um com dois níveis, é conhecido
como o experimento fatorial 2k. O experimento consiste de 2k tentativas, uma tentativa em
cada combinação dos dois níveis dos fatores. Para identificar as tentativas individuais é
utilizada, dentre outras, a seguinte notação:
- Os fatores são representados por letras
- Os níveis pelos sinais de mais (+) e de (-)
- O sinal de mais (+) representa o nível inferior, a condição ou a ausência de
fator.
Obs.: Os japoneses costumam utilizar o número 1 ao invés de (-) e o número 2 ao invés de
(+).
2.2.1.1 Experimentos Fatoriais com K Completos 23
Assim, se há 3 fatores a serem experimentados, teremos um fatorial de 23 com 8

experimentos, os fatores representados pelas letras A,B e C, e o planejamento do
experimento será representado conforme a Tabela 1.
Tabela 1. Matriz Experimental 23

ENSAIO FATORES Resposta
A B C
1 - - -
2 + - -
3 - + -
4 + + -
5 - - +
6 + - +
7 - + +
8 + + +
46
2.2.2 Estimativa dos Efeitos Principais e Interações
Os experimentos fatoriais 2k permitem a estimativa de todos os K efeitos

principais (efeitos de primeira ordem) de todas as interações de dois fatores, de todas as
interações de três fatores, etc. Cada efeito estimado é uma estatística da forma (+) - (-) , ou
seja, é expresso pela diferença entre as duas médias, cada uma contendo 2k-1 observações.
Em um experimento 24 o analista seria, assim, capaz de estimar, além da média
geral, quatro efeitos principais, seis interações de dois fatores, quatro interações de três
fatores, e uma interação de quatro fatores, totalizando um total de 16 estatísticas.
Notavelmente, todas estas estatísticas são “distintas” (ortogonais) umas das
outras, isto é, as magnitudes e sinais de cada estatística não são de maneira alguma
influenciadas pelas magnitudes e sinais das demais.
Para o exemplo de 23 temos:
Exp. A B C Resposta
1 - - - Y1
2 + - - Y2
3 - + - Y3
4 + + - Y4
5 - - + Y5
6 + - + Y6
7 - + + Y7
8 + + + Y8
2.2.2.1 Estimativa dos Efeitos Principais
E = R(+) + R(-)
47
O maior resultado tem o maior efeito.
2.2.2.2 Estimativa dos Efeitos das Interações
Lembrar que: - e + é igual a - 1
Então, o modelo matemático pode ser escrito como:
48
Variável reduzida:
Variância (S2):
Desvio Padrão (S):
Variância Global (Sp2):
i  número de graus de liberdade
=n–1
( n  número de repetições )
2.2.2 Teste t
Testará a significância de cada efeito calculado;
49
Critério: tcalc > ttab ; o efeito é significante
2.3 Cases
2.3.1 Experimento do Helicóptero
Fonte: Fernando Branco Costa
Fatores Nível Baixo ( - ) Nível Alto ( + )
A-Comprimento da Asa 80mm 130mm

B- Comprimento da Haste 80mm 130mm
C-Largura da haste 20mm 40mm
D-Clip de papel sem com
50
Experimentos Fatores Tempo de vôo Tempo Si2
(segundos) Médio
1 A B C D
.
.
16
2.3.2 Otimização do Alcance utilizando o Projeto Experimental

Fatorial Completo 2k
Processo: Arremesso de uma bola com o uso de uma catapulta.

Fator Nível
(-) (+)
A – Posição do dispositivo de arremesso Baixo Alto
B – Ângulo 150 180
C – Posição do dispositivo de tensão Baixo Alto
D – Turno A B
Resposta: Distância (cm)
51
Experimento Fatores Distância (cm)
A B C D 1ª 2ª 3ª Média S2i
1 - - - - 487 460 529 492 1209
2 + - - - 590 566 550 552 172
3 - + - - 455 563 454 491 3924
4 + + - - 561 520 511 511 90
5 - - + - 595 613 598 595 306
6 + - + - 502 578 538 539 1445
7 - + + - 550 598 554 567 709
8 + + + - 641 600 601 614 577
9 - - - + 525 474 456 485 1281
10 + - - + 447 514 490 484 1152
11 - + - + 456 460 438 451 137
12 + + - + 425 496 448 476 632
13 - - + + 618 520 614 584 3076
14 + - + + 588 609 595 597 114
15 - + + + 566 657 560 561 21
16 + + + + 613 610 612 612 2
Tarefa: Executar os experimentos, calcular os efeitos principais e de interação,
fazer o teste t para testar a significância dos efeitos dos fatores, propor um modelo
matemático e testá-lo.
Lembrando-se que:
Abaixo, os efeitos principais e das interações:
EPA = 20 EAB = 16 EBC = 15 EABC = 19

EPB = -55 EAC = -6 EBD = -6,5 EABD = 0
EPC = 91 EAD = 2 ECD = 23,5 EACD = 16
52
EPD = -14 EBCD = -7
EABCD = -16,5
 = 3-1 = 2
S2p = 2 (1209+…+2) / 2 (16) = 926
Sp = S2p = 30,4
Teste “t”:
Agora testaremos a significância de cada efeito calculado;
Critério: tcalc > ttab ; o efeito é significante

Da tabela de estatística T, para o nível de significância de 95% e grau de liberdade
32!
tA = 0,66 < 2,04 Não é significante

tB = 0,18 < 2,04 Não é significante
tC = 2,99 > 2,04 Significante
tD = 0,46 < 2,04 Não é significante
ttabelado 95% = 2,04
Para todos os t’s das interações => não significantes!
53
Ajuste sugerido da Catapulta:
A+B-C+D-
Em relação ao turno (D), pode se utilizar os dois na prática, entretanto tomando-se

medidas para minimizar EP(D).
Entretanto, no experimento a maior média foi obtida com:
A+B+C+D- ! Efeito CD
650
600
Alcance
550
500
450
(-) (+)
nível baixo 511 579 C
nível alto 474 588
54
Efeito AB
650
600
Alcance
550
500
450
(-) (+) B
nível baixo 539 534
nível alto 517 553
Efeito BC
650
600
Alcance
550
500
450
(-) (+) C
nível baixo 503 578
nível alto 482 588
Os gráficos de interações levam a: A+B+C+D+
55
2.3.3 Atividade 1 em Grupo – Fatorial 25 Reactor Example
Variable Low (-) High (+)

1-A Feed Rate (liters/min) 10 15
2-B Catalyst (%) 1 2
3-C Agitation Rate (rpm) 100 120
4-D Temperature (°C) 140 180
5-E Concentration (%) 3 6
Calcular os efeitos principais e de interação e discutir os resultados. Gerar um relatório
Variable % Reacted
1 2 3 4 5
- - - - - 61
+ - - - - 53
- + - - - 63
+ + - - - 61
- - + - - 53
+ - + - - 56
- + + - - 54
+ + + - - 61
- - - + - 69
+ - - + - 61
- + - + - 94
+ + - + - 93
- - + + - 66
+ - + + - 60
- + + + - 95
+ + + + - 98
- - - - + 56
+ - - - + 63
- + - - + 70
+ + - - + 65
- - + - + 59
+ - + - + 55
- + + - + 67
+ + + - + 65
- - - + + 44
+ - - + + 45
- + - + + 78
+ + - + + 77
- - + + + 49
+ - + + + 42
- + + + + 81
+ + + + + 82
56
2.4 Fatoriais Fracionados 2k-p
São frações de um fatorial completo 2K. São muito úteis em etapas investigatórias
(exploratórias) quando se inicia o estudo do processo. Requerem um menor número de
experimentos, se comparados com os fatoriais completos.
Usualmente utilizados quando se tem muitos fatores para investigar e poucos
recursos para a execução dos experimentos.
Ex.: Fatorial Fracionado 25-1 !

p => grau de redução do fatorial!
*5 => fatores
*1 => grau de redução 25-1 ~ 24 => 16 experimentos
Como montar a matriz fracionada?!
57
2.4.1 Atividade 2 em Grupo – Fatorial Fracionado 27-4
Bottleneck at the Filtration Stage of na Industrial Plant
Várias plantas químicas operaram com sucesso por vários anos em diferentes
localidades. Nas plantas antigas o tempo para completar um ciclo particular de filtração foi
40 min, mas numa planta nova este ciclo demorou duas vezes mais, causando prejuízos.
Qual foi a causa desta demora ?
Uma reunião com técnicos foi feita para tentar determinar as causas do problema.
Possibilidades:
1) Engenheiro da planta suspeitou da fonte de água

Planta nova - reserva da cidade
Plantas velhas – poços particulares
(Conteúdo mineral de água pode afetar a filtração)
2) Superintendente do processo suspeitou da origem da matéria prima
Fonte deste material na planta nova era diferente do que as fontes das plantas antigas.
3) Químico suspeitou do nível de temperatura de filtração. Temperatura na planta nova
era um pouco mais baixa do que nas outras plantas.
4) Presença de um dispositivo de reciclagem na planta nova que não existe nas plantas
antigas.
5) Velocidade de adição de soda cáustica. Estava mais alta na planta nova. O chefe dos
operadores sugeriu que esta velocidade seja diminuída para resolver o problema.
6) Tipo de pano de filtro. Um novo tipo foi usado na planta nova. O superintendente do
processo falou que seria relativamente simples de substituir este pano.
7) “holdup time”. Este tempo foi mais baixo na planta nova. O engenheiro de controle de
qualidade sugeriu que talvez este tempo fosse a causa do problema.
A pessoa responsável por este estudo achou que provavelmente somente uma ou
duas destas condições foram responsáveis pelo problema. A chance de que mais do que
duas variáveis sejam significantes foi considerada remota.
58
Foi decidido usar um planejamento fatorial fracionado 27-4 que tem resolução III
(efeitos principais e de interação de 2ª ordem são misturados).
Fatores Níveis
(-) (+)
A – Fonte de Água Reserva Poço
B – Matéria Prima Nova Velha
C – Temperatura Baixa Alta
D – Reciclagem Sim Não
E – Soda Cáustica Rápida Devagar
F- Pano de Filtro Novo Velho
G – Hold up tima Baixo Alto
Exp A B C AB AC BC ABC Tempo de Filtração (min)

D E F G
1 68.4
2 77.7
3 66.4
4 81.0
5 78.6
6 41.2
7 68.7
8 38.7
Pedem-se :
a) calcular os efeitos dos fatores
b) discutir os resultado e fazer uma primeira proposta de ajuste do processo, com as
decisões necessárias
59
2.4 Método de Plackett-Burman
São experimentos fatoriais fracionados saturados.
N=8 +++–+––
N = 12 ++-+++–––+–
N = 20 ++––++++–+–+––––++–
N = 24 +++++–+–++––++––+–+––––
Permite investigar (N-1) fatores!
Matriz N = 12
Exp 1 2 3 4 5 6 7 8 9 10 11 Resposta
1 + + - + + + - - - + - 85
2 + - + + + - - - + - + 114
3 - + + + - - - + - + + 67
4 + + + - - - + - + + - 64
5 + + - - - + - + + - + 56
6 + - - - + - + + - + + 68
7 - - - + - + + - + + + 13
8 - - + - + + - + + + - 108
9 - + - + + - + + + - - 90
10 + - + + - + + + - - - 22
11 - + + - + + + - - - + 130
12 - - - - - - - - - - - 23
Resultado com 6 variáveis reais e 5 variáveis (fantasmas) ou inertes.
- a experiência ‘1’ sempre traz os sinais da matriz inicial

- e a última experiência sempre teremos “-“ para todos os fatores
60
2.4.1 Atividade 3 em Grupo – Variável resposta: dureza de um
material
Coluna Fator Variável Nível

- +
1 A Controle de Tensão Manual Automático
2 B Máquina 1 2
3 C Vazão (gal/min) 10 20
4 D Mistura Simples dupla
5 E Temperatura (oC) 200 250
6 F Umidade (%) 20 80
7 G “Fantasma”
8 H “Fantasma”
9 I “Fantasma”
10 J “Fantasma”
11 K “Fantasma”
61
2.4.2 Atividade 4 em Grupo – Junta de Vedação
Num problema industrial, deseja-se verificar exploratoriamente, a influência de 6
variáveis de processo (fatores) nas variáveis resposta de uma Junta de Fibra (produto). Para
tal, optou-se por um Planejamento “Plackett-Burman” com N=12, sendo 6 variáveis reais e
5 variáveis inertes (fantasmas). As variáveis estão descritas na tabela a seguir:
Fatores Níveis
(+) (-)
A – Teor de Ligante Alto Baixo
B –Fantasma * *
C – Teor total de Fibras (%) Alto Baixo
D – Cargas A B
E – Teor de Fibras Orgânicas Alto Baixo
F – Fibras Orgânicas A B
G – Fantasma * *
H – Fantasma * *
I – Fantasma * *
J – Fibras Inorgânicas A B
K – Fantasmas * *
Variáveis Respostas
1 Espessura
2 Densidade
3 Resistência à Tração
4 Compressão 5000 psi
5 Relaxação 5000 psi
6 Compressão 1000 psi
8 Flexibilidade
9 Retenção
10 Creep
62
Os resultados estão na tabela a seguir
Fatores Variáveis Resposta

Exp
A B C D E F G H I J K 1 2 3 4 5 6 7 8 9 10
1 1 1 -1 1 1 1 -1 -1 -1 1 -1 1,07 1,07 62 30 29 25 43 3,2 86 54
2 1 -1 1 1 1 -1 -1 -1 1 -1 1 1,2 0,95 41 42 26 29 47 4,8 86 50
3 -1 1 1 1 -1 -1 -1 1 -1 1 1 1,12 0,95 6 37 20 35 39 25,4 80 51
4 1 1 1 -1 -1 -1 1 -1 1 1 -1 1,23 0,91 12 44 31 44 50 9,6 84 74
5 1 1 -1 -1 -1 1 -1 1 1 -1 1 0,87 1,21 31 40 24 27 49 8 79 52
6 1 -1 -1 -1 1 -1 1 1 -1 1 1 1,1 1,14 52 37 33 32 46 8 95 73
7 -1 -1 -1 1 -1 1 1 -1 1 1 1 0,97 1,02 9 38 16 30 35 25,4 75 36
8 -1 -1 1 -1 1 1 -1 1 1 1 -1 1,11 1,05 42 39 25 31 47 6,4 88 48
9 -1 1 -1 1 1 -1 1 1 1 -1 -1 0,83 1,2 19 30 17 21 32 22,4 75 36
10 1 -1 1 1 -1 1 1 1 -1 -1 -1 1,02 1,05 28 33 28 29 47 8 80 45
11 -1 1 1 -1 1 1 1 -1 -1 -1 1 0,93 1,15 32 37 21 25 43 3,2 80 43
12 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0,71 1,39 12 41 15 25 39 9,6 75 49
Pedem-se :
a) Efeitos principais do fatores sobre as 10 respostas
b) Testar a significância dos efeitos ( teste t – usar “fantasmas” para estimar Sp2)
c) Propor uma condição de ajuste do processo que atenda à maior parte das necessidades
das variáveis resposta. Deseja-se minimizar a variável resposta 1 e maximizar as
demais.
2.4 Método de Taguchi: Engenharia Robusta
Ferramentas do Método:
 Arranjos Ortogonais (Matrizes Experimentais)

 Analise de Variância (ANAVA ou ANOVA)
 Razão Sinal/Ruído => S/N ou 
Condições Comuns:
 Maior-é-melhor => S/N = -10 log ( 1/y2)/n

 Menor-é-melhor => S/N = -10 log ( y2)/n
 Nominal-é-melhor => S/N = 10 log (y2)/(S2)
y => valor da resposta

n => n° de repetições
S2 => variância
Arranjos Ortogonais (Matrizes Experimentais)
Recebem a designação Ln, onde n representa o n° de condições experimentais da

matriz.
Matrizes Experimentais Arranjos Ortogonais
Convencionais
Nível Alto + 3
Nível Intermediário 0 2
Nível Baixo - 1
L9 => até 4 fatores !
2.4.1 Case: Taguchi
Efeitos dos fatores sobre (S/N) ou 
Column Number and Fator Assigned

Exp. 1 2 3 4 Observation
Temperature Pressure Setling Cleaning N
(A) (B) (C) (D) (dB)
1 1 1 1 1 -20
2 1 2 2 2 -10
3 1 3 3 3 -30
4 2 1 2 3 -25
5 2 2 3 1 -45
6 2 3 1 2 -65
7 3 1 3 3 -45
8 3 2 1 3 -65
9 3 3 2 1 -70
Cálculo dos Efeitos :

Fator A
MA1 = -20 - 10 - 30 = -20

3
MA2 = -25 - 45 - 65 = -45
3
MA3 = -45 - 65 - 70 = -60

3
Fator B
MB1 = -20 - 25 - 45 = -30

3
MB2 = -10 - 45 - 65 = -40

3
MB3 = -30 - 65 - 70 = -55

3
Fator C
MC1 = -20 - 65 - 65 = -50

3
MC2 = -10 - 25 - 70 = -45

3
MC3 = -30 - 45 - 45 = -40

3
Fator D
MD1 = -20 - 45 - 70 = -45

3
MD2 = -10 - 65 - 45 = -40

3
MD3 = -30 - 25 - 65 = -40

3
Média: -41,67
A e B influenciam mais!
Representação gráfica
0
-10
-20
-30
-40
-50
-60
-70
1 2 3 1 2 3 1 2 3 1 2 3
A B C D
A1B1C2D3 ou 2 => menor variabilidade possível!
Análise de Variância (ANOVA)
Usaremos o exercício anterior para mostrar como se monta uma Tabela de Análise
de Variância.
Soma Total dos Quadrados (STQ):
STQ =  (i - médio)2
médio = -41,67
STQ = (-20+41,67)2 + (-30+41,67)2 + .... + (-70+41,67)2

STQ = 3800
Soma dos Quadrados dos Fatores (SQF)

Fator A:
SQF(A) = 3 (mA1 - médio)2 + 3 (mA2 - médio)2 + 3 (mA3 - médio)2
Onde:
3 => n° de condições experimentais no nível “i”.

Assim:
SQF(A) SQF(B) SQF(C) SQF(D)

2450 950 350 50
Soma Quadrática do Erro (SQerro)
SQ(Erro) = STQ -  SQF
SQ(Erro) = 3800 – 3800 = 0 (erro calculado) => deve-se estimar o erro!
TABELA ANOVA
Fonte de Variação SQF g.l SMQF F
Fator A 2450 2 1225 12,25
Fator B 950 2 475 4,75
Fator C * 350 *2 175 -
Fator D * 50 *2 25 -
ERRO (*) 400 (*) 4 100 -
Onde:
SMQF = SQF/g.l e F = SMQF/SMQFERRO

 => usados para estimar o erro!
“Se F >= 2,0 => efeito é significante!”
Capítulo 4: Relatórios Gerenciais
Fonte: Leandro Valim de Freitas
A seguir serão apresentadas as principais etapas para geração de relatórios

gerenciais no software empresarial Minitab®. Cada etapa será explorada em detalhes na
sala de aula.
1ª. Etapa: Criar um experimento: Stat / DOE / Factorial / Create Factorial Design
Nessa etapa é possível escolher o número de níveis e fatores. Em seguida, entre na

opção Designs para determinar se trata de um experimento fatorial completo ou fracionado
e, se serão realizadas réplicas.
2ª. Etapa: Cálculo dos efeitos, coeficientes e ANOVA. Stat / DOE / Factorial / Analyse
Factorial Design
Os relatórios serão reportados na Session:

3ª. Etapa: Geração dos gráficos dos efeitos dos fatores. Stat / DOE / Factorial /
Factorial Plots

Aulas Estatistica Feg 2016

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aulas Estatistica Feg 2016

Enviado por

Direitos autorais:

Formatos disponíveis

Unesp

Universidade Estadual Paulista

GUARATINGUETÁ, SP – setembro de 2016

• Engenheiro Industrial Químico (EEL-USP-FAENQUIL)

Prof. Dr. Fabrício Maciel Gomes

• Engenheiro Industrial Químico (EEL-USP)

Fonte: Pedro Paulo Balestrassi (UNIFEI)

A essência da ciência é a observação. A ciência que se preocupa com a organização,

1.1 Grandes Áreas

A Estatística Descritiva está relacionada com a organização e descrição de dados

1.2 Medidas Estatísticas

* Média Aritmética simples ( x )

Usada em dados não agrupados em classes.

* Média Aritmética ponderada (também x )

Agora, para dados agrupados em classes, temos:

É o valor “do meio” de um conjunto de dados, quando os dados estão dispostos em

35, 36, 37, 38, 40, 40, 41, 43 ,46  x~  40

12, 14, 14, 15, 16, 16, 17, 20  x~  15 2 16  15,5

A média é muito sensível a valores extremos de um conjunto de observações,

Ex.: { 200, 250, 250, 300, 450, 460, 510 }

Ex.: { 200, 250, 250, 300, 450, 460, 2300 }

Devido ao valor 2300, ~

É obtida eliminando do conjunto as m maiores e as m menores observações.

Ex.: {200, 250, 250, 300, 450, 460, 2300}

250  250  300  450  460

* A moda e a classe modal (mo)

Obs.: A moda geralmente não é fornecida em calculadoras.

1.2.2 Medidas de Dispersão ou Variabilidade

Nos seguintes conjuntos de dados, por exemplo:

Como anteriormente definida, R tem o inconveniente de levar em conta somente os dois

* Desvio Médio (DM(x)), Variância (S2,Var(X) ou 2) e Desvio Padrão (S,DP(X)

Aqui o princípio básico é analisar os desvios das observações em relação à média

Duas opções para analisar os desvios das observações são:

a) considerar o total dos desvios em valor absoluto ou;

Assim, para o conjunto A, teríamos, respectivamente:

Associando estas medidas à média, temos:

O uso do DM(x) pode causar dificuldades quando comparamos conjuntos de dados

DM(x) = 6/5 = 1.2 e

O cálculo do desvio padrão exige o cálculo prévio da variância e uma fórmula

Relacionados à inferência estatística, alguns autores usam (n - 1) como divisor para

Para dados agrupados em classes, a variância é dada por:

É intuitivamente claro que a multiplicação de cada parcela (xi - x )2 por ni significa

1.3.1 Como construir Histogramas

a) Construção da Tabela de Freqüências.

Exemplo: A Tabela 1 mostra as medidas de pH de 90 amostras de uma solução ácida.

R = Maior valor – Menor valor

Passo 2: Determinação dos intervalos de classe:

No exemplo: 0,043 + 0,002 = 21,5 22 intervalos

Portanto o intervalo de classe determinado é 0,005

Passo 3 : Preparação da tabela de freqüência

Passo 5: Cálculo do ponto médio da classe.

Ponto médio = Soma do valor superior e inferior da classe

Ponto médio 1ª classe = 2,5005 + 2,5055 = 2,503

Ponto médio 2ª classe = 2,5055 + 2,5105 = 2,508

Passo 6: Obtenção da Freqüência

Registrar os valores na tabela (vide tabela anterior).

1.3.2 Como construir graficamente o Histograma

Passo 2: Em cada intervalo de classe, levantar um retângulo (barra) correspondente à

a) Geral (simétrico) b) Combinado (Multi-modal)

c) Positivamente desviado d) Precipício à esquerda

e) Platô f) 2 Picos (Bimodal)

1.3.4 Interpretação do Histograma

a) Geral (simétrico): O valor médio do histograma está enquadrado no centro da amplitude