Você está na página 1de 30

MOQ-23 ESTATÍSTICA

Professor: Rodrigo A. Scarpel


rodrigo@ita.br
www.mec.ita.br/~rodrigo
Programa do curso:

SEMANA CONTEÚDO
9 Inferência baseada em 2 amostras
10 Teste de aderência e análise de dados categorizados
Regressão linear simples. Estimação dos parâmetros pelo
11 método dos mínimos quadrados. Coeficiente de determinação.
Aplicações de modelos de regressão linear.
12 Prova
Hipóteses de um modelo de regressão. Estimação de parâmetros
13 pelo método da máxima verossimilhança. Inferência em análise de
regressão. Previsão utilizando regressão linear simples.
14 Regressão linear múltipla.
Distribuição F de Snedcor. Análise de variância (ANOVA).
15 Princípios de experimentação e algumas aplicações em
engenharia
16 Prova
MOQ-23 ESTATÍSTICA
ANÁLISE DE VARIÂNCIA

Professor: Rodrigo A. Scarpel


rodrigo@ita.br
www.mec.ita.br/~rodrigo
O processo de inferência:

TESTAR
ADERÊNCIA

POPULAÇÃO
ESTIMAÇÃO DOS
AMOSTRA PARÂMETROS

FAZER INFERÊNCIAS EM
HIPÓTESES
RELAÇÃO A POPULAÇÃO

Hipóteses: - iid ⇒ Amostra aleatória

- Distribuições populacional e amostral (TLC)

σ)
- Parâmetros conhecidos ou não (σ
Princípios:
•A análise de variância (ANOVA) é um conjunto de procedimentos
estatísticos para a análise de respostas quantitativas de unidades
experimentais.
•Ela pode ser vista como um teste de hipóteses utilizado para
comparar as médias de mais de duas populações.
Exemplos:
• A eficiência de diversas marcas de remédios para o
tratamento de uma mesma doença.
• O consumo em km/litro de diferentes marcas, do mesmo
porte, de carro abastecido com combustíveis do mesmo
tipo.
• A vida útil de componentes produzidos utilizando
diferentes processos de fabricação.
Conceitos da ANOVA:
•Objetivo: Avaliar se as diferenças observadas entre as médias das amostras
são estatisticamente significantes, ou seja, se uma variação de médias das
amostras pode ser conseqüência da variação amostral ou é uma boa
evidência da diferença entre as médias das populações.
•Sejam a: número de populações ou tratamentos sendo comparados
µ1, ..., µi: média da população ou do tratamento i, i = 1,...,a
yij: valor da j-ésima medida da i-ésima população(tratamento), j=1,...,n
yi.: média da i-ésima população (tratamento), i=1,...,a
y..: média geral
Conceitos da ANOVA:
• A variabilidade total das amostras pode ser dividida em duas partes,
ou fontes de variabilidade:
• A primeira parte de variabilidade é proveniente de as
populações serem diferentes, denominada variabilidade entre.
Quanto maior for a variabilidade entre, mais forte é a
evidência de as médias das populações serem diferentes.
• A segunda parte de variabilidade é causada pelas diferenças
dentro de cada amostra, denominada variabilidade dentro.
Quanto maior for a variabilidade dentro, maior será a
dificuldade para concluir se as médias das populações são
diferentes.

• Assim, ⇒ SS = SST + SSE


Procedimento da ANOVA:
• O teste de hipóteses para a níveis de um fator é estabelecido
da seguinte forma:
H0: µ1 = µ2 = µ3 ... = µa
HA: Nem todas as populações têm a mesma média

•A distribuição F conduzirá a decisão de aceitar o rejeitar a


hipótese nula, comparando o F observado Fo calculado com a
expressão:
Variância entre S b2
Fo = = 2
Variância dentro S w

com o F crítico, Fc, correspondente ao nível de significância α


adotado.
Distribuição F (Snedecor-Fisher) :
µ1,σ
• Considere duas amostras aleatórias: X1, X2, …, Xn1 ~N(µ σ12), Y1, Y2, …, Yn2
µ2,σ
~N(µ σ22). Então
(n1 − 1)S12
S12 σ 12
σ 12
=
(n1 − 1) ~ F
S 22 (n2 − 1)S 22 ( n1 −1),( n2 −1)

σ 22 σ 22
(n2 − 1)
F é a razão de duas X2 independentes divididas pelos seus g.l. e é utilizada na
comparação de variâncias amostrais.
Proposição: quando Ho é verdadeira, E(QMTr) = E(QME) = σ2, ao passo
que, quando Ho for falsa, E(QMTr) > E(QME) = σ2,ou seja, ambas são não
σ2), quando Ho
tendenciosas para estimar a variância comum da população (σ
for verdadeira, mas QMTr tende a superar σ2 quando Ho for falsa.
Procedimento da ANOVA:
• Cálculo da variância dentro: Sw2

∑ (X i − X 1 ) + K + ∑ (X i − X k )
n1 nk
2 2

SSE
S w2 = i =1 i =1
= = MSE
n1 + n2 + K + nk − k nT − k

•Cálculo da variância entre: Sb2

S =
2 ( )2
n1 X 1 − X + K + nk X k − X ( )
2

=
SST
= MST
k −1 k −1
b
Procedimento da ANOVA:
• Cálculo da variância total: SS

(X − X )
n1 + n2 +L+ nk 2
SS = ∑ i
i =1

SS − SSE
Demonstra-se que SS = SSE + SST ⇒ S = 2

k −1
b

SST
S b2 k − 1 MST
• Cálculo do F observado: Fo = 2 = =
Sw SSE MSE
nT − k
Tabela ANOVA:
• Análise de variância pela tabela ANOVA:
MOQ-23 ESTATÍSTICA
PRINCÍPIOS DE EXPERIMENTAÇÃO

Professor: Rodrigo A. Scarpel


rodrigo@ita.br
www.mec.ita.br/~rodrigo
Introdução à experimentação:

A criação de experimentos é uma parte natural do processo de tomada de


decisão em engenharia e ciências.

Exemplo: Um engenheiro está investigando o efeito de diferentes métodos


de cura na resistência média de compressão do concreto.

No exemplo, a investigação é de 1 FATOR (método de cura) que pode


ter vários NÍVEIS (tipos de tratamento).

- Se número de níveis = 2 → Diferença entre médias

- Se número de níveis > 2 → Análise de variância

- Se o fator for uma variável contínua → Análise de regressão


Importância em engenharia (PROCESSOS):

Normalmente, os processos podem ser “descritos” utilizando variáveis de


controle (exemplos: temperatura, pressão, viscosidade). Assim, utilizando
experimentação é possível determinar qual subconjunto das variáveis de
processo tem maior influência na sua performance.

Como resultado é possível obter:

 Melhoria da performance de processos de manufatura

 Redução da variabilidade e maior conformidade (target requirements)

 Desenvolvimento de novos processos

 Detecção das causas de falhas

 Redução no custo de operação


Importância em engenharia (PROCESSO ROBUSTO):

Fatores Controláveis
x1 x2 x3 x4 xp
y1
...
y2
Entrada Saída y3
Processo y4
...

...
ym
z1 z2 z3 z4 zq
Fatores Incontroláveis
(ruídos)

Que fatores mais influenciam y?

Como ajustar x de modo que y tenha o valor desejado?

Como ajustar x de modo que y tenha variação mínima?

Como ajustar x de modo que os efeitos de z sobre y sejam mínimos?


Importância em engenharia (PROCESSO ROBUSTO):

 Exemplo: Moldagem Plástica

Fatores Controláveis
x1 x2 x3 x4 xp
y1
...
y2
Entrada Saída y3
Processo y4
...

...
ym
z1 z2 z3 z4 zq
Fatores Incontroláveis
(ruídos)

X: Tempo de injeção, tempo de resfriamento, temperatura do molde,


velocidade de injeção, pressão de injeção.

Y: Rebarba, Deformação, Falha

Z: Operador
Importância em engenharia (PRODUTOS):

Em desenvolvimento de novos produtos, a utilização de técnicas de


experimentação permite:

 Avaliar e comparar configurações de projetos

 Avaliar e comparar diferentes materiais

 Selecionar parâmetros de projeto para que o produto funcione bem


em diferentes condições de operação (projeto mais robusto)

 Determinar os parâmetros de projeto chave que afetam a


performance do produto.

Como resultado, busca-se desenvolver produtos mais simples de fabricar,


com maior performance, mais confiáveis e projetados, desenvolvidos e
produzidos em um menor tempo.
Processo de experimentação:
 A experimentação é feita de forma seqüencial:
1. O primeiro experimento em um sistema complexo (processo de manufatura)
que possui muitas variáveis de controle é um piloto (screening experiment)
utilizado na identificação das variáveis mais importantes.
2. Experimentos subseqüentes são feitos para refinar a informação e determinar
quais ajustes nas variáveis críticas são necessários para melhorar o processo.
3. Otimização: é o objetivo final da experimentação. Consiste em determinar os
níveis ótimos das variáveis críticas (resultarão no processo com a melhor
performance possível).
 Todo experimento envolve uma seqüência de atividades:
1. Conjectura: a hipótese original que motiva o experimento
2. Experimento: o teste realizado para investigar a conjectura
3. Análises: as análises (estatísticas) aplicadas aos dados do experimento
4. Conclusão: o que foi aprendido em relação a conjectura.
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.

 Conjectura: Um fabricante de papel está interessado em aumentar a


resistência à tração de seu produto. De acordo com engenheiros de produto,
a resistência à tração de papéis está relacionada a concentração lenhosa do
papel e esta varia de 5% a 20%.
 Experimento: A equipe de engenheiros responsável por este estudo decidiu
investigar 4 níveis de concentração lenhosa: 5%, 10%, 15% e 20%. Eles
decidiram fazer seis coletas de dados para cada nível de concentração. A
resistência à tração de todas as 24 amostras foram medidas, sendo a
seqüência aleatória.
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Planejamento do Experimento:
Concentração lenhosa Replicação Amostra Aleatório Amostra Aleatório
1 1 0,2383 16 0,0763
2 2 0,2004 22 0,0930
3 3 0,7198 2 0,2004
5% 4 4 0,3921 Sequência de 24 0,2245
5 5 0,7419 mensuração 1 0,2383
6 6 0,9203 11 0,3158
1 7 0,7278 14 0,3203
2 8 0,4475 21 0,3899
3 9 0,7510 4 0,3921
10% 4 10 0,6384 8 0,4475
5 11 0,3158 20 0,4575
6 12 0,9478 10 0,6384
1 13 0,8914 17 0,6893
2 14 0,3203 3 0,7198
3 15 0,7741 7 0,7278
15% 4 16 0,0763 5 0,7419
5 17 0,6893 9 0,7510
6 18 0,8473 15 0,7741
1 19 0,9819 18 0,8473
2 20 0,4575 23 0,8727
3 21 0,3899 13 0,8914
20% 4 22 0,0930 6 0,9203
5 23 0,8727 12 0,9478
6 24 0,2245 19 0,9819
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Dados coletados:

 Análises: - Análise de variância (ANOVA)


- Análise de regressão
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Análises: verificação da normalidade
Concentração lenhosa Replicação Amostra Resistência à tração
7 + 8 + ... + 10
1 1 7 -1,0607 Média = = 10
2 2 8 -0,7071 6
3 3 15 1,7678
5% 4 4 11 0,3536 (7 − 10) 2 + ... + (10 − 10) 2
5 5 9 -0,3536 Dp = = 2,828
6 6 10 0,0000 5
1 7 12 -1,3073
7 − 10
2 8 17 0,4754 V1 = = −1,0607
10%
3 9 13 -0,9508 2,828
4 10 18 0,8319
5 11 19 1,1885 M
6 12 15 -0,2377
10 − 10
V6 = =0
1 13 14 -1,6771
2 14 18 0,5590
3 15 19 1,1180 2,828
15% 4 16 17 0,0000
5 17 16 -0,5590
6 18 18 0,5590
1 19 19 -0,8209
2 20 25 1,4523
3 21 22 0,3157
20% 4 22 23 0,6946
5 23 18 -1,1997
6 24 20 -0,4420
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Análises: verificação da normalidade
Dados Ordenados Z
-1,6771 1 -2,0368
-1,3073 2 -1,5341
QQNorm
-1,1997 3 -1,2582
-1,0607 4 -1,0545
-0,9508 5 -0,8871 2,5000
-0,8209 6 -0,7416 2,0000
-0,7071 7 -0,6103
-0,5590 8 -0,4888 1,5000
-0,4420 9 -0,3741 1,0000
-0,3536 10 -0,2641
-0,2377 11 -0,1573 0,5000
0,0000 12 -0,0522
Zi

0,0000
0,0000 13 0,0522
0,3157 14 0,1573 -0,5000
0,3536 15 0,2641 -1,0000
0,4754 16 0,3741
0,5590 17 0,4888 -1,5000
0,5590 18 0,6103 -2,0000
0,6946 19 0,7416
-2,5000
0,8319 20 0,8871
-2,5000 -1,5000 -0,5000 0,5000 1,5000 2,5000
1,1180 21 1,0545
1,1885 22 1,2582 Dados padronizados
1,4523 23 1,5341
1,7678 24 2,0368
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Análises:
Concentração lenhosa Replicação Amostra Resistência à tração C5% C10% C15% C20%
1 1 7 1 0 0 0
2 2 8 1 0 0 0
3 3 15 1 0 0 0
5% 4 4 11 1 0 0 0
5 5 9 1 0 0 0
6 6 10 1 0 0 0
1 7 12 0 1 0 0
2 8 17 0 1 0 0
3 9 13 0 1 0 0
10% 4 10 18 0 1 0 0
5 11 19 0 1 0 0
6 12 15 0 1 0 0
1 13 14 0 0 1 0
2 14 18 0 0 1 0
3 15 19 0 0 1 0
15% 4 16 17 0 0 1 0
5 17 16 0 0 1 0
6 18 18 0 0 1 0
1 19 19 0 0 0 1
2 20 25 0 0 0 1
3 21 22 0 0 0 1
20% 4 22 23 0 0 0 1
5 23 18 0 0 0 1
6 24 20 0 0 0 1
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Análises:
RESUMO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,86385
R-Quadrado 0,74624
R-quadrado ajustado 0,70818
Erro padrão 2,55114
Observações 24

ANOVA
gl SQ MQ F F de significação
Regressão 3 382,7917 127,5972 19,6052 0,0000
Resíduo 20 130,1667 6,5083
Total 23 512,9583

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores


Interseção 10,00000 1,04150 9,60154 0,00000 7,82747 12,17253
C10% 5,66667 1,47290 3,84728 0,00101 2,59425 8,73909
C15% 7,00000 1,47290 4,75252 0,00012 3,92758 10,07242
C20% 11,16667 1,47290 7,58140 0,00000 8,09425 14,23909
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.
 Análises:
C5% C10% C15% C20%
7 12 14 19
8 17 18 25
15 13 19 22
11 18 17 23
9 19 16 18
10 15 18 20

Anova: fator único

RESUMO
Grupo Contagem Soma Média Variância
C5% 6 60 10 8
C10% 6 94 15,66666667 7,866666667
C15% 6 102 17 3,2
C20% 6 127 21,16666667 6,966666667

ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 382,7916667 3 127,5972222 19,605207 3,59258E-06 3,098392654
Dentro dos grupos 130,1666667 20 6,508333333

Total 512,9583333 23
Planejamento e análise dos Experimentos:
 CASO 1: Experimento fatorial completo (1 fator, k níveis) com n replicações
e seqüência aleatória.

 Conjectura: Um fabricante de papel está interessado em aumentar a


resistência à tração de seu produto. De acordo com engenheiros de produto,
a resistência à tração de papéis está relacionada a concentração lenhosa do
papel e esta varia de 5% a 20%.
 Conclusão: A conjectura está correta (a resistência à tração está relacionada
a concentração lenhosa do papel) e é possível especificar a concentração
necessária para atender requisitos de resistência.
Para casa:

• Lista de Exercícios 11 (site: www.mec.ita.br/~rodrigo/)

• Leitura: Devore – cap. 10 (10.1): A análise de variância

Walpole et al. – cap. 13 (13.1 a 13.3): Experimentos com 1 fator: geral