Escolar Documentos
Profissional Documentos
Cultura Documentos
FACULDADE DE ENGENHARIA
CAMPUS DE GUARATINGUETÁ
MBA-PRO
ESTATÍSTICA
PARA A
TOMADA DE DECISÃO
Prof. Dr. Messias Borges Silva e Prof. M.Sc. Fabricio Maciel Gomes
2
Capítulo 1: Uma breve revisão de Estatística Descritiva
3
1.2.1 Medidas de Posição
Mostram o valor representativo em torno do qual os dados tendem a agrupar-se
com maior ou menor freqüência.
x x x n
x i
i 1
x 1 2
n n
x p x p x n pn
x p i i
i 1
x 1 1 2 2 onde,
p1 p2 pn n
p i
i 1
pi = peso da amostra xi
i 1
A média aritmética simples pode ser vista como a média ponderada com todos os
pesos iguais. Para efeito de nomenclatura sempre trataremos a média aritmética simples ou
ponderada simplesmente por média ( x ).
* Mediana ( ~
x)
n 1
o
x
Se n é ímpar ~ termo
2
4
n n
o o
termo 1 termo
2 2
Se n é par ~
x
2
Ex.:
x 345,7 x~ 300
Tanto x como ~
x são boas medidas de posição.
x = 601 ~
x = 300
* A Média Aparada
5
É o valor que representa a maior freqüência em um conjunto de observações
individuais. Para dados agrupados temos a classe modal. Em alguns casos pode haver mais
de uma moda. Assim temos uma distribuição bimodal, trimodal, etc.
Ex.:
x
mo
X xi ni
10 |— 20 15 2
20 |— 30 25 4
30 |— 40 35 10 Classe Modal
40 |— 50 45 6
50 |— 60 55 2
Distribuição
Bimodal
mo I mo II x
A = { 3, 4, 5, 6, 7 }
B = { 1, 3, 5, 7, 9 }
C = { 5, 5, 5, 5 }
D = { 3, 5, 5, 7 }
E = { 3.5, 5, 6.5 }
6
Temos em todos eles a mesma média. A identificação de cada um desses conjuntos
de dados pela sua média nada informa sobre as diferentes variabilidades dos mesmas.
Algumas medidas que sintetizam essa variabilidade são:
* Amplitude (R):
xi x 2 1 0 1 2 6 e
i 1
x x 4 1 0 1 4 10
2
i
i 1
xi x
i 1
DM(x)= que é o desvio médio.
n
n
x x
2
i
= i 1
S2 que é a variância ( Var(x))
n
7
Sendo a variância uma medida que expressa um desvio quadrático médio, é
conveniente usar uma medida que expresse a mesma unidade dos dados originais. Tal
medida é o desvio padrão S (ou DP(x)), dada por:
S S2
Ex.:
Em A = { 3, 4, 5, 6, 7 } temos:
Em D = { 3, 5, 5, 7 } temos:
DM(x) = 1,0 e
S2 = 2,0
Assim, podemos dizer que, segundo o Desvio Médio, o Grupo D é mais homogêneo
(tem menor dispersão) do que A, enquanto que ambos tem a mesma homogeneidade
segundo a variância. O desvio médio possui pequena utilização em estatística e em geral
vale 0.8 vezes o desvio padrão
x x x
2 2
i i
i 1 i 1
S2 x2
n n
x x
2
i
i 1
S2 , e isto será visto adiante (tendenciosidade).
n1
Obs.: Muitas calculadoras científicas possuem duas medidas para desvio padrão. Uma
associada à divisão por n (simbolizada geralmente por ou n) e outra associada à divisão
por n - 1 (simbolizada geralmente por S ou n-1). Verifique a simbologia usada pela sua
calculadora, caso você possua uma!
8
K
x x
2
i ni K
i 1
x x
2
S
2
ou S 2 i fi
n i 1
1.3 Histogramas
Fonte: Messias Borges Silva
Os dados obtidos de uma amostra servem como base para a decisão sobre uma
população. Quanto maior for o tamanho da amostra maior será a informação sobre a
população.
Mas à medida que aumenta o tamanho da amostra fica difícil o entendimento da
população, se estes dados estiverem dispostos apenas em uma tabela.
Para facilitar então o entendimento, construímos o histograma, que permitirá
entender a população de forma objetiva.
9
Tabela 1. Medidas de pH de 90 amostras de solução ácida
Nº pH medido
amostra
1 – 10 2,510 2,517 2,522 2,522 2,510 2,511 2,519 2,532 2,543 2,525
11 – 20 2,527 2,536 2,506 2,541 2,512 2,515 2,521 2,536 2,529 2,524
21 – 30 2,529 2,523 2,523 2,523 2,519 2,528 2,543 2,538 2,518 2,534
31 – 40 2,520 2,514 2,512 2,534 2,526 2,530 2,532 2,526 2,523 2,520
41 – 50 2,535 2,523 2,526 2,525 2,532 2,522 2,502 2,530 2,522 2,514
51 – 60 2,533 2,510 2,542 2,524 2,530 2,521 2,522 2,535 2,540 2,528
61 – 70 2,525 2,515 2,520 2,519 2,526 2,527 2,522 2,542 2,540 2,528
71 – 80 2,531 2,545 2,524 2,522 2,520 2,519 2,519 2,529 2,522 2,513
81 – 90 2,518 2,527 2,511 2,519 2,531 2,527 2,529 2,528 2,519 2,521
10
Máximo Mínimo
Nº pH medido Valor Valor da
amostra
Linha Linha
1 – 10 2,510 2,517 2,522 2,522 2,510 2,511 2,519 2,532 2,543 2,525 2,543 2,510
11 – 20 2,527 2,536 2,506 2,541 2,512 2,515 2,521 2,536 2,529 2,524 2,541 2,506
21 – 30 2,529 2,523 2,523 2,523 2,519 2,528 2,543 2,538 2,518 2,534 2,543 2,518
31 – 40 2,520 2,514 2,512 2,534 2,526 2,530 2,532 2,526 2,523 2,520 2,534 2,512
41 – 50 2,535 2,523 2,526 2,525 2,532 2,522 2,502 2,530 2,522 2,514 2,535 2,502
51 – 60 2,533 2,510 2,542 2,524 2,530 2,521 2,522 2,535 2,540 2,528 2,542 2,510
61 – 70 2,525 2,515 2,520 2,519 2,526 2,527 2,522 2,542 2,540 2,528 2,542 2,515
71 – 80 2,531 2,545 2,524 2,522 2,520 2,519 2,519 2,529 2,522 2,513 2,485 2,513
81 – 90 2,518 2,527 2,511 2,519 2,531 2,527 2,529 2,528 2,519 2,521 2,531 2,511
Maior Menor
Valor Valor
2,545 2,502
11
Passo 1: Calcular a Amplitude de R.
R = 2,545 - 2.502
R = 0,043
12
Passo 4: Determinação dos Extremos de cada classe.
Primeiro determine o menor valor da 1ª classe e adicione o valor calculado do
intervalo de classe(no exemplo 0,005). Então o intervalo da 1ª classe fica entre
2,5005 e 2,5055 de forma que a classe inclui o menor valor 2,502. O intervalo da
2ª classe fica entre 2,5055 e 2,5105 e assim por diante.
Registrar esses intervalos na tabela.
Passo 1: Numa tabela quadrada, marcar no eixo vertical do lado esquerdo, a freqüência de
observações e do lado direito a porcentagem. No eixo horizontal os intervalos de classes.
Passo 3: Nos espaços em branco, registrar dados informativos: tamanho de amostra, média,
desvio padrão.
13
14
1.3.3 Tipos de Histogramas
15
g) Pico Isolado
b) Combinado (multi-modal): Muitas classes possuem uma freqüência baixa. Obs. Este
tipo ocorre quando o número de unidades de dados incluídos nas classes varia de classe ou
quando existe uma tendência particular em função do arredondamento dos dados.
e) Platô: A freqüência em cada classe forma um platô pelo fato das classes possuirem mais
ou menos a mesma freqüência exceto para aqueles que estão no final. Obs. Este tipo ocorre
com mistura de diversas distribuições possuindo valores diferentes de médias.
f) Dois Picos (Bimodal): A freqüência é baixa no centro da amplitude dos dados e existe
um pico de cada lado. Obs. Este tipo ocorre quando duas distribuições com diferentes
valores de médias são misturados.
g) Pico Isolado: Existe um pequeno pico isolado em adição ao tipo geral. Obs. Este caso
aparece quando existem pequenas inclusões de dados oriundos de diferentes distribuições,
16
como no caso de anormalidade no processo, erro de medida ou inclusão de dados oriundos
de diferentes processos.
Se existe uma especificação devemos levantar linhas dos limites superior e inferior
de especificação (LSE) e (LIE) no histograma para comparar a distribuição com a
especificação. A partir daí verificar se o histograma está bem localizado dentro dos limites.
Casos típicos:
a)
b)
17
2) Histograma não satisfaz as especificações
18
2. Distribuições de Probabilidade
P {X = X0} = P(X0)
Pa X b
Relembrando: uma variável aleatória é uma função com valores numéricos, cujos valores
são determinados por fatores de chance.
Uma variável aleatória é considerada discreta se toma valores que podem ser
contados.
Uma variável aleatória é considerada contínua quando pode tomar qualquer valor
em determinado intervalo.
19
Exemplo: Distribuição de probabilidade para a variável aleatória “número de caras em duas
jogadas de uma moeda”.
n
E ( X ) pi X i sendo X a V.A. discreta
i 1
ou
E( X ) X f X dX
sendo X a V.A. contínua
0 1 1 1 2 1 1
4 2 4
20
A variância:
4 2 4
Var ( X ) 0 2 1 12 1 2 2 1 12 0,5
O desvio padrão:
0,5 0,71
P (0 ) P ( x 0 ) 1 p
P (1) P ( X 1) p
21
4. O resultado (isto é, sucesso ou fracasso) de qualquer observação independe do
resultado de qualquer outra observação.
n n
P ( X ) p X 1 p
n X n!
e
X X X !(n X )!
n
onde: representa o número de combinações de n objetos tomados X de cada vez.
X
np
2 n p 1 p
X
onde p é a proporção de sucessos na amostra p
n
100
0,010 1 0,01
100 0
P ( X 0) 0,366
0
100
0,011 1 0,01
100 1
P ( X 1) 0,370
1
100
0,012 1 0,01
100 2
P ( X 2) 0,185
2
22
100
0,013 1 0,01
100 3
P ( X 3) 0,061
3
100
0,014 1 0,01
100 4
P ( X 4) 0,015
4
e X
P( X ) onde X = 0, 1, 2, ...
X!
onde:
P(X) = probabilidade de X sucessos, dado o conhecimento de .
= número esperado de sucessos.
e = constante matemática (aproximadamente 2,71828)
23
X = número de sucessos por unidade.
Exemplo: Suponha que o número de defeitos no cordão de solda de uma carroceria siga
uma distribuição de Poisson com = 2. Então a probabilidade de uma carroceria apresentar
mais de 3 defeitos será:
e 2 20
P ( X 0) 0,135
0!
e 2 21
P ( X 1) 0,271
1!
e 2 22
P ( X 2) 0,271
2!
e 2 23
P ( X 3) 0,180
3!
e 4 25
P ( X 5) 0,0,1563 15,63%
5!
24
1. Inúmeros fenômenos contínuos parecem seguí-la ou podem ser aproximados por
meio dela.
2. Podemos utilizá-la para aproximar várias distribuições de probabilidade discretas.
3. Ela oferece a base para a inferência estatística clássica, devido à sua afinidade com
o teorema do limite central.
onde:
e = constante matemática (aproximada por 2,71828).
= constante matemática (aproximada por 3,14159).
µ = média aritmética da população.
= desvio padrão da população.
X = qualquer valor da variável aleatória contínua onde - ≤ X .
25
Para simplificar a notação de uma v.a.c. com distribuição normal, com média µ e
variância 2 utiliza-se:
X ~ N (, 2)
a
P( X a) F (a) f ( X )dX função de densidade açumulada
Essa integral não pode ser resolvida em forma fechada, mas a solução está
apresentada em tabelas onde se entra com a variável reduzida ou variável padronizada Z e
encontra-se F(Z) ou vice-versa.
a
P ( X a) P Z F( X )
Exemplo: O peso de um produto é uma característica muito importante. Sabe-se que o peso
segue um modelo normal com média de 1000 gramas e desvio padrão 40 gramas. Se a
especificação técnica estabelece que o peso deve ser maior que 950 gramas, qual a
probabilidade de que um pacote selecionado aleatoriamente satisfaça a especificação?
950 1000
P ( X 950) P Z P (Z 1,25) 0,3944 0,5 0,8944 89,44%
40
Exemplo 2: Sabe-se que X representa medições feitas em um processo que segue o modelo
Normal com média de 100 e desvio padrão 10. Se forem feitas 4000 medições, quantas
estarão entre 95 e 112?
26
95 100 112 100
P (95 X 112) P Z
10 10
Se forem feitas 4000 medições, aproximadamente 2305 estarão entre 95 e 112. (4000 x
57,64%)
Exemplo: uma urna contém dez bolas, numeradas de 0 a 9. Retira-se a primeira bola, anota-
se o número, 3 por exemplo, e não se recoloca a bola na urna. Os outros números que
podem ser sorteados são 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema é o sistema sem reposição.
Entretanto, se tivéssemos recolocado a bola 3 na urna, então todos os números poderiam
ser selecionados na segunda extração, inclusive o 3. Este sistema é chamado sistema com
reposição.
27
Em geral, quando uma amostragem é sem reposição, dizemos que a população é
finita.
Quando uma amostragem é com reposição, então dizemos que a população é
infinita, pois a população nunca será exaurida. Para fins práticos a amostragem de uma
população finita muito grande pode ser considerada infinita.
Sejam:
X = média da população = µ
X = média da distribuição amostral.
X = desvio padrão da população =
X = desvio padrão da distribuição amostral.
N = tamanho da população.
n = tamanho da amostra.
N n
População finita: X e X
n N 1
População infinita: X e X
n
28
A fórmula do desvio padrão nos diz que a quantidade de dispersão na distribuição
amostral depende de dois fatores:
a dispersão da população
o tamanho da amostra (utilizando raiz quadrada)
Exemplo: Calcule o desvio padrão da distribuição amostral de médias onde o desvio padrão
da distribuição populacional é 2 e o tamanho da amostra é 40.
X 2
X 0,3162
n 40
Determine a média das distribuições de médias amostrais, sendo que a média populacional
é 678.
X X 678
29
O procedimento é análogo ao visto no capítulo referente à distribuição normal, entretanto
deve-se utilizar o valor de X = 50 e X =10.
Exemplo 3: Um fabricante de baterias alega que seu artigo de primeira categoria tem uma
vida esperada (média) de 50 meses. Sabe-se que o desvio padrão correspondente é de 4
meses. Que percentagem de amostras de 36 observações acusará vida média no intervalo de
1 mês em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida média das
baterias?
Sabemos que, como n> 30, a distribuição das médias amostrais será aproximadamente
normal com média igual à média populacional e desvio padrão igual ao desvio padrão
populacional dividido pela raiz quadrada do tamanho da amostra. Além disso, vamos
pressupor população infinita, pois a produção de baterias não termina (teoricamente!).
X 4
X 0,67 para n = 36.
n 36
P 49 X 51 Z
XX
X
49 50
0,67
1,5
30
P 51 X 50 Z
XX
X
51 50
0,67
1,5
P 49 X 51 P ( 1,5 Z 1,5) 0,4332 0,4332 0,8664 86,64%
p 1 p
p
n
e pode-se fazer uma aproximação para a distribuição normal quando n> 30.
p p 72,3%
p 1 p 0,6 1 0,6
p 0,049
n 100
Exemplo 3: Verificou-se que 2% das ferramentas produzidas por uma certa máquina são
defeituosas. Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3%
ou mais revelarem-se defeituosas?
31
p 1 p 0,02 1 0,02
p p 2% e p 0,007
n 400
0,03 0,02
P p 0,03 P Z P Z 1,43 0,07636 7,34%
0,007
4. Estimação
Exemplos:
32
ordem de 2º C. entre 1º C e 3º C.
População
Infinita Finita
Estimativa de médias:
Pontual X X
Intervalar
X conhecido X X N n
X Z X Z
n n n 1
X desconhecido SX SX N n
X t X t
n n N 1
Intervalar p 1 p p 1 p N n
p p
n n N 1
Onde:
33
t representa o valor tabelado da distribuição t de Student, com nível de confiança e GL
graus de liberdade.
N é o tamanho da população.
n é o tamanho da amostra.
X X
2
eZ n Z n Z X
n e e
34
p 1 p p 1 p
2
Z 2 p (1 p)
eZ e 2 Z n
n n e2
Exemplo: Que tamanho de amostra será necessário para produzir um intervalo de 90% de
confiança para a verdadeira média da população, com erro de 1,0 em qualquer dos sentidos,
se o desvio padrão da população é 10?
2 2
10
n Z X n 1,65 272,25 tamanho da amostra 273
e 1
5. Teste de Hipóteses
Utilizam-se duas hipóteses, sendo chamadas de hipótese nula (H0) e hipótese alternativa
(H1).
35
A hipótese nula H0 é uma afirmação que diz que o parâmetro populacional é tal
como especificado (isto é, a afirmação é verdadeira).
A hipótese alternativa H1 é uma afirmação que oferece uma alternativa à alegação
(isto é, o parâmetro é maior, ou menor, que o valor alegado).
Exemplo: O estudo de uma amostra de tamanho 55 peças indicou que o diâmetro médio é
de 27,5 mm. Então:
Se H0 é
Verdadeira Falsa
Aceitar H0 Decisão Correta Erro Tipo 2 ()
Ação
Rejeitar H0 Erro Tipo 1 () Decisão Correta
36
5.1. Teste de Hipóteses para Médias
5.1.1. X Conhecido
H0 : µ = µ0
H1 : µ µ0
H0: µ = 0,850;
H1: µ 0,850.
0,847 0,850
Z teste 0,85
0,010
8
Como Zteste = -0,85 > - Z0,025 = - 1,96. H0 não pode ser rejeitada.
Conclusão: não podemos afirmar que os entalhes sejam diferentes que o especificado, ao
nível de significância de 0,05.
37
5.1.2. X Desconhecido
Quando não se conhece o desvio padrão da população, deve-se estimá-lo a partir dos
dados amostrais usando o desvio padrão amostral. Quando isso ocorre (na maioria das
situações reais X é desconhecido), a distribuição t é a distribuição amostral adequada.
Suponha que X é uma variável aleatória Normal com média µ e variância 2
desconhecidas. Para testar a hipótese de que a média é igual a um valor especificado µ o.
formulamos:
H0: µ = µ0
H1: µ µ0
Esse problema é idêntico àquele da seção anterior, exceto que agora a variância é
desconhecida.
Como X não é conhecido, usa-se a distribuição de Student para construir a
estatística do teste:
X
t teste
SX
n
E a hipótese nula H0 é rejeitada se [tteste] > t/2, onde t/2, n-1 é um valor limite da
distribuição de Student tal que a probabilidade de se obter valores externos a t/2 é .
Os testes de duas amostras são usados para decidir se as médias de duas populações
são iguais. Exigem-se amostras independentes, ou seja, uma de cada população. Eles são
freqüentemente utilizados para comparar dois métodos de ensino, duas cidades, duas
marcas, duas fábricas, ....
OBS: dados provenientes de antes-depois são dependentes, não podendo, portanto, serem
tratados por este método.
5.2.1. X Conhecido
H0: 1 = 2
H1: 1 2
38
X1 X 2
Z teste
12 22
n1 n2
5.2.2. X Desconhecido
X1 X 2
t teste
S12 S 22
n1 n 2
Este tipo de teste é apropriado quando os dados sob análise consistem de contagem
ou freqüências de itens em duas ou mais classes. A finalidade de tal teste é avaliar
afirmações sobre a proporção (ou percentagem) de uma população. O teste se baseia na
premissa de que uma proporção amostral será igual à verdadeira proporção populacional, a
menos da variabilidade amostral. O teste foca na diferença entre o número esperado de
ocorrências (supondo-se verdadeira uma afirmação) e o número efetivamente observado. A
diferença é então comparada com a variabilidade prescrita por uma distribuição amostral
baseada na hipótese de que H0 é realmente verdadeira.
Quando a finalidade da amostragem é julgar a validade de uma alegação acerca de
uma proporção populacional, é apropriado o teste para proporções. Onde:
H0: p = p0
H1: p p0
X p0
Z teste n
p0 1 p
n
e deve ser comparada com o valor cr tico de Z (retirado de uma tabela da distribuição
normal)
39
Exemplo: Um fabricante afirma que uma remessa de pregos contém menos de 1% de
defeituosos. Uma amostra aleatória de 200 pregos acusa 4 defeituosos. Teste a afirmação ao
nível 0,01.
H0: p = 1%
H1: p > 1% pois desejamos evitar a aceitação de uma remessa com
mais de 1% de defeituosos, mas nada há contra aceitar o fato da
remessa apresentar qualidade superior à acordada.
X p0 4 0,01
Z teste n 200 1,42
p0 1 p 0,01 1 0,01
n 200
Ou seja, estamos testando se as duas variáveis são ou não associadas, por exemplo,
se queremos testar se a proporção de mulheres e de homens que trabalham no horário
noturno em uma fábrica são iguais, automaticamente estaremos testando se sexo e turno de
trabalho são variáveis associadas.
Este teste baseia-se na distribuição qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A decisão de aceitar ou rejeitar H0 dependerá da
comparação deste valor com o valor tabelado da distribuição qui-quadrado.
Por exemplo, tem-se a distribuição de peças produzidas por turno e se essas peças
são boas ou apresentam algum tipo de defeito. No turno da manhã foram produzidas 967
peças, onde 183 apresentaram algum tipo de defeito.
Turno de Produção
Total
Manhã Tarde Noite
Peças com algum defeito 183 30 11 224
40
O teste baseia-se na pressuposição que, se as duas variáveis fossem independentes,
então o valor esperado de cada célula poderia ser encontrado fazendo-se:
Freqüências Esperadas
Turno de Produção
Total
Manhã Tarde Noite
Peças com algum defeito 137,1 41,7 45,2 224
224 967
Frequência Esperada 137,1
1580
2 O E 2
E
Se o valor obtido for maior que o valor crítico obtido na tabela 2 então diz-se que
as variáveis NÃO são independentes. Se o valor encontrado for menor, então diz-se que as
variáveis são independentes.
O valor dos GRAUS DE LIBERDADE é obtido através do cálculo:
No exemplo apresentado:
2
183 137,12 30 41,72 ... 308 273,82 51,88
137,1 41,7 273,8
e o valor crítico encontrado na tabela para (2-1) x (3-1) = 2 graus de liberdade e nível de
significância 0,05 é 5,991.
Tem-se valor calculado > valor tabelado então diz-se que as variáveis NÃO são
independentes. OU SEJA, a proporção de peças boas produzidas depende do turno de
41
trabalho. A proporção de peças boas no turno da manhã é 81%, na tarde 90% e na noite
97%.
42
Capítulo 2: Projeto de Experimentos
Projeto de Experimentos (DOE, Design of Experiments), ferramenta que vem
sendo utilizada para verificar o funcionamento de sistemas ou processos produtivos,
permitindo melhoria destes, redução na variabilidade, e conformidade próxima do
resultado desejado, além de redução no tempo de processo e, consequentemente, nos
custos operacionais.
Podemos, brevemente, citar alguns benefícios do DOE:
Planejamento;
Execução dos experimentos;
Análise dos dados;
Experimento de confirmação;
Conclusão.
2.1 Definições
43
Experimento: Um conjunto planejado de operações com o objetivo de
descobrir novos fatos ou confirmar ou negar resultados de investigações anteriores.
Fator: (Variável independente) Um “fator” é uma das variáveis controladas ou
não, que exercem influência sobre a resposta que está sendo estudada no experimento. Um
fator pode ser quantitativo, isto é, a temperatura em graus, o tempo em segundos. Um fator
pode, também, por exemplo, ser qualitativo, ter diferentes máquinas, diferentes operadores,
interruptor ligado ou desligado, catalisador A ou B.
Nível: Os “Níveis” de um fator são os valores do fator examinado no
experimento. Para os fatores quantitativos, cada valor escolhido constituiu um nível, isto é,
se o experimento deve ser conduzido em quatro temperaturas diferentes, então o fator
“temperatura” possuiu quatro “níveis”. No caso dos fatores qualitativos, “o interruptor
ligado ou desligado” representa dois níveis para o fator interruptor; caso estejam sendo
utilizadas seis máquinas por três operadores, então o fator “máquina” tem seis níveis,
enquanto o fator “operador” tem três níveis.
Tratamento: Um “Tratamento” é um nível atribuído a um fator único durante
um experimento, por exemplo, a temperatura a 800 graus. Uma “combinação de
tratamento” é o conjunto de níveis para todos os fatores num dado experimento. Por
exemplo, um experimento utilizando temperatura de 800 graus, máquina 3, operador A, e
interruptor desligado constituir-se-ia numa combinação de tratamento.
Unidades Experimentais: As “Unidades Experimentais” consistem em
objetos, materiais ou unidades aos quais se aplicam os tratamentos. Podem ser entidades
biológicas, materiais naturais, produtos manufaturados etc.
Ambiente Experimental: O “Ambiente Experimental” compreende as
condições ambientais que podem vir a influenciar os resultados do experimento de modo
conhecido ou desconhecido.
Delineamento de Experimento: O plano formal para a condução do
experimento é chamado “delineamento de experimento” ou “modelo experimental”. Ele
inclui a escolha de respostas, fatores, níveis, blocos e tratamentos, além da utilização de
determinadas ferramentas chamadas agrupamento planejado, aleatorização e replicação.
Aleatorização: A seqüência de experimentos e/ou a atribuição de amostras a
diferentes combinações de tratamento de maneira puramente casual é denominada
44
“Aleatorização”. Tal atribuição aumenta a probabilidade de que o feito de variáveis
incontroláveis seja eliminado.
Também aprimora a validade das estimativas da variância dos erros
experimentais e torna possível a aplicação de testes estatístico de significância, além de
construção de intervalos de confiança. Sempre que possível, a aleatorização deve fazer
parte do experimento.
Replicação: A “Replicação” é a repetição de uma observação ou medição de
forma a aumentar a precisão ou fornecer os meios para medir a precisão. Uma replicação
única consiste de uma única observação ou realização do experimento. Proporciona uma
oportunidade para que se eliminem os efeitos de fatores incontroláveis ou de fatores
desconhecidos pelo experimentador e assim, com a aleatorização, atua como ferramenta
diminuidora de tendências. A replicação também ajuda a detectar erros graves nas
medições. Nas replicações de grupos de experimentos, diferentes aleatorização devem ser
aplicadas a cada grupo.
2.2.1 Experimentos Fatoriais com K Fatores (cada fator com dois níveis)
46
2.2.2 Estimativa dos Efeitos Principais e Interações
Exp. A B C Resposta
1 - - - Y1
2 + - - Y2
3 - + - Y3
4 + + - Y4
5 - - + Y5
6 + - + Y6
7 - + + Y7
8 + + + Y8
E = R(+) + R(-)
47
O maior resultado tem o maior efeito.
48
Variável reduzida:
Variância (S2):
=n–1
( n número de repetições )
2.2.2 Teste t
49
Critério: tcalc > ttab ; o efeito é significante
2.3 Cases
50
Experimentos Fatores Tempo de vôo Tempo Si2
(segundos) Médio
1 A B C D
.
.
16
51
Experimento Fatores Distância (cm)
A B C D 1ª 2ª 3ª Média S2i
1 - - - - 487 460 529 492 1209
2 + - - - 590 566 550 552 172
3 - + - - 455 563 454 491 3924
4 + + - - 561 520 511 511 90
5 - - + - 595 613 598 595 306
6 + - + - 502 578 538 539 1445
7 - + + - 550 598 554 567 709
8 + + + - 641 600 601 614 577
9 - - - + 525 474 456 485 1281
10 + - - + 447 514 490 484 1152
11 - + - + 456 460 438 451 137
12 + + - + 425 496 448 476 632
13 - - + + 618 520 614 584 3076
14 + - + + 588 609 595 597 114
15 - + + + 566 657 560 561 21
16 + + + + 613 610 612 612 2
Tarefa: Executar os experimentos, calcular os efeitos principais e de interação,
fazer o teste t para testar a significância dos efeitos dos fatores, propor um modelo
matemático e testá-lo.
Lembrando-se que:
52
EPD = -14 EBCD = -7
EABCD = -16,5
= 3-1 = 2
Sp = S2p = 30,4
Teste “t”:
53
Ajuste sugerido da Catapulta:
A+B-C+D-
A+B+C+D- ! Efeito CD
650
600
Alcance
550
500
450
(-) (+)
nível baixo 511 579 C
nível alto 474 588
54
Efeito AB
650
600
Alcance
550
500
450
(-) (+) B
nível baixo 539 534
nível alto 517 553
Efeito BC
650
600
Alcance
550
500
450
(-) (+) C
nível baixo 503 578
nível alto 482 588
55
2.3.3 Atividade 1 em Grupo – Fatorial 25 Reactor Example
Variable % Reacted
1 2 3 4 5
- - - - - 61
+ - - - - 53
- + - - - 63
+ + - - - 61
- - + - - 53
+ - + - - 56
- + + - - 54
+ + + - - 61
- - - + - 69
+ - - + - 61
- + - + - 94
+ + - + - 93
- - + + - 66
+ - + + - 60
- + + + - 95
+ + + + - 98
- - - - + 56
+ - - - + 63
- + - - + 70
+ + - - + 65
- - + - + 59
+ - + - + 55
- + + - + 67
+ + + - + 65
- - - + + 44
+ - - + + 45
- + - + + 78
+ + - + + 77
- - + + + 49
+ - + + + 42
- + + + + 81
+ + + + + 82
56
2.4 Fatoriais Fracionados 2k-p
São frações de um fatorial completo 2K. São muito úteis em etapas investigatórias
(exploratórias) quando se inicia o estudo do processo. Requerem um menor número de
experimentos, se comparados com os fatoriais completos.
Usualmente utilizados quando se tem muitos fatores para investigar e poucos
recursos para a execução dos experimentos.
57
2.4.1 Atividade 2 em Grupo – Fatorial Fracionado 27-4
Bottleneck at the Filtration Stage of na Industrial Plant
Várias plantas químicas operaram com sucesso por vários anos em diferentes
localidades. Nas plantas antigas o tempo para completar um ciclo particular de filtração foi
40 min, mas numa planta nova este ciclo demorou duas vezes mais, causando prejuízos.
Qual foi a causa desta demora ?
Uma reunião com técnicos foi feita para tentar determinar as causas do problema.
Possibilidades:
58
Foi decidido usar um planejamento fatorial fracionado 27-4 que tem resolução III
(efeitos principais e de interação de 2ª ordem são misturados).
Fatores Níveis
(-) (+)
A – Fonte de Água Reserva Poço
B – Matéria Prima Nova Velha
C – Temperatura Baixa Alta
D – Reciclagem Sim Não
E – Soda Cáustica Rápida Devagar
F- Pano de Filtro Novo Velho
G – Hold up tima Baixo Alto
Pedem-se :
a) calcular os efeitos dos fatores
b) discutir os resultado e fazer uma primeira proposta de ajuste do processo, com as
decisões necessárias
59
2.4 Método de Plackett-Burman
N=8 +++–+––
N = 12 ++-+++–––+–
N = 20 ++––++++–+–+––––++–
N = 24 +++++–+–++––++––+–+––––
Matriz N = 12
Exp 1 2 3 4 5 6 7 8 9 10 11 Resposta
1 + + - + + + - - - + - 85
2 + - + + + - - - + - + 114
3 - + + + - - - + - + + 67
4 + + + - - - + - + + - 64
5 + + - - - + - + + - + 56
6 + - - - + - + + - + + 68
7 - - - + - + + - + + + 13
8 - - + - + + - + + + - 108
9 - + - + + - + + + - - 90
10 + - + + - + + + - - - 22
11 - + + - + + + - - - + 130
12 - - - - - - - - - - - 23
60
2.4.1 Atividade 3 em Grupo – Variável resposta: dureza de um
material
61
2.4.2 Atividade 4 em Grupo – Junta de Vedação
Num problema industrial, deseja-se verificar exploratoriamente, a influência de 6
variáveis de processo (fatores) nas variáveis resposta de uma Junta de Fibra (produto). Para
tal, optou-se por um Planejamento “Plackett-Burman” com N=12, sendo 6 variáveis reais e
5 variáveis inertes (fantasmas). As variáveis estão descritas na tabela a seguir:
Fatores Níveis
(+) (-)
A – Teor de Ligante Alto Baixo
B –Fantasma * *
C – Teor total de Fibras (%) Alto Baixo
D – Cargas A B
E – Teor de Fibras Orgânicas Alto Baixo
F – Fibras Orgânicas A B
G – Fantasma * *
H – Fantasma * *
I – Fantasma * *
J – Fibras Inorgânicas A B
K – Fantasmas * *
Variáveis Respostas
1 Espessura
2 Densidade
3 Resistência à Tração
4 Compressão 5000 psi
5 Relaxação 5000 psi
6 Compressão 1000 psi
8 Flexibilidade
9 Retenção
10 Creep
62
Os resultados estão na tabela a seguir
Pedem-se :
a) Efeitos principais do fatores sobre as 10 respostas
b) Testar a significância dos efeitos ( teste t – usar “fantasmas” para estimar Sp2)
c) Propor uma condição de ajuste do processo que atenda à maior parte das necessidades
das variáveis resposta. Deseja-se minimizar a variável resposta 1 e maximizar as
demais.
2.4 Método de Taguchi: Engenharia Robusta
Ferramentas do Método:
Condições Comuns:
Fator B
Fator C
Fator D
Média: -41,67
A e B influenciam mais!
Representação gráfica
0
-10
-20
-30
-40
-50
-60
-70
1 2 3 1 2 3 1 2 3 1 2 3
A B C D
Usaremos o exercício anterior para mostrar como se monta uma Tabela de Análise
de Variância.
Soma Total dos Quadrados (STQ):
médio = -41,67
Onde:
TABELA ANOVA
Fonte de Variação SQF g.l SMQF F
Fator A 2450 2 1225 12,25
Fator B 950 2 475 4,75
Fator C * 350 *2 175 -
Fator D * 50 *2 25 -
ERRO (*) 400 (*) 4 100 -
Onde:
1ª. Etapa: Criar um experimento: Stat / DOE / Factorial / Create Factorial Design