Escolar Documentos
Profissional Documentos
Cultura Documentos
INFERÊNCIA ESTATÍSTICA
Decisão sobre
Amostra admissibilidade
da amostra.
• HIPÓTESE ALTERNATIVA:
Geralmente é formulada em termos de
desigualdades, e comumente corresponde ao que se
quer provar.
TESTE DE HIPÓTESES
• As hipóteses podem ser:
a) Substituindo o processador A pelo
processador B, altera-se o tempo de resposta de um
computador;
H0: 𝜇𝐴 = 𝜇𝐵 e H1: 𝜇𝐴 ≠ 𝜇𝐵
Onde:
• 𝜇𝐴 é o tempo médio de resposta com o processador A;
e
• 𝜇𝐵 é o tempo médio de resposta com o processador B;
d) A implementação de um programa de
melhoria da qualidade em uma empresa prestadora
de serviços melhora a satisfação de seus clientes;
H0: 𝑝2 = 𝑝1 e H1: 𝑝2 < 𝑝1 ;
TESTE DE HIPÓTESES
• As hipóteses podem ser colocadas em forma de
parâmetros populacionais:
a) A média dos tempos de resposta do
equipamento com o processador A é diferente da
média dos tempos de resposta com o processador B;
• 𝑝 = probabilidade de cara;
H0: 𝑝 = 0,5;
H1: 𝑝 ≠ 0,5.
NÍVEL DE SIGNIFICÂNCIA
Representa a probabilidade tolerável de se
rejeitar H0 quando esta for verdadeira.
Coroa Cara
Valor 𝑝 = 0,002 ou 2%
TESTE DE HIPÓTESES
• CONCLUSÃO:
Valor 𝑝 = 0,002 é menor que o nível de
significância, (probabilidade de uma moeda honesta
acusar um valor tão distante quanto ao que se
observou na amostra). Probabilidade muito
pequena!!!
• Qual é a conclusão?
O teste rejeita H0, ou seja, prova-se
estatisticamente que a moeda é viciada.
TESTE DE HIPÓTESES
• Situação 2:
Valor obtido: y = 7 caras.
• Qual é a conclusão?
O teste aceita H0, ou seja, não se pode afirmar
que a moeda é viciada.
NÍVEL DE SIGNIFICÂNCIA
• REGRA DE DECISÃO:
Onde:
• 𝑝 : probabilidade do sistema A apresentar melhor
desempenho que o sistema B.
NÍVEL DE SIGNIFICÂNCIA
• Distribuição Binomial: (𝑛 = 12; p = 0,5);
Onde:
• 𝑝0 : valor da proporção, segundo H0;
• 𝑛 : tamanho da amostra;
• 𝑦 ′ : correção de continuidade.
TESTE PARA PROPORÇÃO
ABORDAGEM DO VALOR -P
Obtenção de p
Amostra Cálculo de z pela tabela da
normal
𝑦 ′ − 𝑛. 𝑝0
𝑧=
𝑛. 𝑝0 (1 − 𝑝0 ) Se unilateral
Se bilateral: Se unilateral à à esquerda:
direita:
TESTE PARA PROPORÇÃO
ABORDAGEM DO VALOR -P
Aceita H0
Rejeita H0
EXEMPLO 8.6 BARBETTA
• Uma empresa retira periodicamente amostras
aleatórias de 500 peças de sua linha de produção
para analise de qualidade. As peças da amostra
são classificadas como defeituosas ou não, sendo
que a politica da empresa exige que o processo
produtivo seja revisto se houver evidência de mais
que 1,5% de peças defeituosas. Na ultima amostra
foram encontradas 9 peças defeituosas. Usando
um nível de significância de 1%, o processo
precisa ser revisto?
RESULTADO
• H0: 𝑝 = 0,015; H1: 𝑝 > 0,015; Usar 𝛼 = 0,01;
• Amostra: 𝑦 = 9 em 𝑛 = 500;
9
𝑝= = 0,018
500
Nível de
significância α
Obtenção do valor
crítico
normal
pela tabela ...
TESTE PARA PROPORÇÃO
ABORDAGEM CLÁSSICA
TESTE PARA PROPORÇÃO
ABORDAGEM CLÁSSICA
Obtenção do
Nível de valor crítico pela Cálculo do
significância α tabela normal valor z
Se bilateral:
Obtenção do
Nível de Cálculo do
valor crítico pela
significância α valor z
tabela normal
Se unilateral a direita:
Aceita H0 Rejeita H0
EXEMPLO 8.6 BARBETTA
• H0: 𝑝 = 0,015; e H1: 𝑝 > 0,015. Usar α = 0,01
Regra de decisão:
Aceita H0 Rejeita H0
RESULTADO
• Da amostra temos:
𝑦 ′ −𝑛.𝑝0
• 𝑧= = 0,37
𝑛.𝑝0 (1−𝑝0 )
Amostra:
• N=10;
• Média da amostra=6,82;
• Desvio padrão da amostra=0,551;
6,82 − 7,4 ∗ 10
𝑡= = −3,33
0,551
RESULTADOS
• Uso da tabela t para obter o valor p:
RESULTADOS
• Uso da tabela t para obter o valor p:
RESULTADOS
Como observado na tabela t, a área apontada
é entre 0,0025 < 𝑣𝑎𝑙𝑜𝑟 𝑝 < 0,005 , então o teste
estatístico rejeita H0 em favor de H1.
Onde:
• 𝜇1 : valor esperado da resposta sob o tratamento 1;
• 𝜇2 : valor esperado da resposta sob o tratamento 2;
Onde:
• 𝑑 : é a média das diferenças observadas;
• 𝑛 : é o tamanho da amostra(número de pares);
• 𝑠𝑑 : é o desvio padrão das diferenças observadas.
EXEMPLO
• Supondo populações de distribuição normal, usa-
se a distribuição t de Student, com 𝑔𝑙 = 𝑛 − 1
graus de liberdade.
1 246 − (10)(3,4)²
𝑠𝑑 = ∗ 𝑑𝑖2 −𝑛∗ 𝑑2 = = 3,81
𝑛−1 9
𝑖
EXEMPLO
A estatística fica da seguinte forma:
𝑑 ∗ 𝑛 3,4 ∗ 10
𝑡= = = 2,82
𝑠𝑑 3,81
Conferindo na tabela t com 𝑔𝑙 = 10 − 1 = 9:
EXEMPLO
• O valor calculado, 𝑡 = 2,82, está bem próximo de
2,821 apresentado na tabela de distribuição t, o
que nos fornece um valor para 𝑝 = 0,01 , menor
que o nível de significância adotado, de 5%(0,05).
Onde:
• 𝑠12 : variância da amostra 1;
• 𝑠22 : variância da amostra 2;
• 𝑠𝑎2 : variância agregada das duas amostras.
TESTE T PARA DUAS AMOSTRAS
INDEPENDENTES
• Estatística do teste:
𝑛
𝑡 = 𝑥1 − 𝑥2 ∗
2 ∗ 𝑠𝑎2
Onde:
• 𝑥1 : média da amostra 1;
• 𝑥2 : média da amostra 2;
• 𝑛 : tamanho da amostra em cada grupo.
TESTE T PARA DUAS AMOSTRAS
INDEPENDENTES
• Usa-se para o cálculo a distribuição t de Student
com graus de liberdade (supondo populações com
distribuição normal).
• Continuação(ex. 9.3):
Amostra 1: 𝑛 = 10; 𝑥1 = 49,9; 𝑒 𝑠12 = 35,656;
35,656+42,233
Variância Agregada: 𝑠𝑎2 = = 38,945;
2
10
𝑡 = 49,9 − 44,7 = 1,86
2 ∗ 38,94
TESTE T PARA DUAS AMOSTRAS
INDEPENDENTES
Graus de Liberdade: 𝑔𝑙 = 2𝑛 − 2 = 2 ∗ 10 − 2 = 18;
Abordagem do valor p:
TESTE T PARA DUAS AMOSTRAS
INDEPENDENTES
• O valor de t obtido pelo cálculo aponta para uma
região entre 0,025 e 0,05, mas como o teste é
bilateral, a área deve ser dobrada para se obter o
valor correto:
• 𝜇𝑖 = 𝜇 + 𝜏𝑖 = média do fator i.
COMPARAÇÃO ENTRE VÁRIOS
TRATAMENTOS
• HIPÓTESES:
H0: 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑔 = 0 ou 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑔 ;
H1: 𝜏𝑖 ≠ 0 ou 𝜇𝑖 ≠ 𝜇𝑗
As observações:
Onde:
• 𝑔 : grupos;
• 𝑛 : repetições;
Graus de Liberdade:
𝑔𝑙 = 𝑁 − 1
𝑁 =𝑛∗𝑔
Onde:
• 𝑁 : tratamentos;
Análise de variância (ANOVA), com um fator
Soma de Quadrados do Tratamento:
𝑔 𝑛 𝑔
Onde:
• 𝑔 : grupos;
• 𝑛 : repetições
Graus de Liberdade:
𝑔𝑙 = 𝑔 − 1
Análise de variância (ANOVA), com um fator
• Soma de quadrados do erro:
𝑔 𝑛
Onde:
• 𝑔 : grupos;
• 𝑛 : repetições;
• Graus de liberdade:
𝑔𝑙 = 𝑁 − 𝑔
Onde:
• 𝑁 : tratamentos;
Análise de variância (ANOVA), com um fator
𝑔 𝑛
Total 𝑦 2
..
𝑁−1
2
𝑆𝑄𝑇𝑜𝑡 = 𝑦𝑖𝑗 −
𝑁
𝑖=1 𝑗=𝑖
TESTE F
• Se H0: 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑔 = 0 for verdadeira e
considerando as suposições anteriormente
enunciadas, a estatística f tem distribuição F com
(g - 1) graus de liberdade no numerador e (N - g)
graus de liberdade no denominador.
f
TESTE F
• Após calculada a estatística f, usa-se a tabela de
distribuição F de Snedecor, para encontrar (), com
graus de liberdade no numerador, e graus de
liberdade no denominador. A regra de decisão é
dada por:
177,3 2
𝑆𝑄𝑇𝑜𝑡 = 1344,25 − = 34,45
24
Aceita H0 (Dados
não mostram
evidências para
aceitar H1)
ANÁLISE DOS RESÍDUOS
• Avaliação das suposições da ANOVA através de
gráficos dos resíduos:
ESTIMAÇÃO DAS MÉDIAS
• Intervalo de confiança para o valor esperado da
resposta sob o i-ésimo tratamento (nível de conf.
𝛾):
𝑄𝑀𝐸𝑟𝑟𝑜
𝐼𝐶 𝜇𝑖 , 𝛾 = 𝑦𝑖. ± 𝑡𝛾
𝑛
Onde:
• 𝑡𝛾 : valor encontrado na tabela t;
• 𝛾 : nível de confiança;
ESTIMAÇÃO DAS MÉDIAS
• Ex. 9.4: Usando nível de confiança de 95% e 𝑔𝑙
= 𝑁 − 𝑔 = 24 − 3 = 21 , temos 𝑡95% = 2,08, então,
para a rede C1 temos:
0,55
𝐼𝐶 𝜇𝑖 , 95% = 8,21 ± 2,08 = 8,21 ± 0,55
8
ANOVA COM UM FATOR
Onde:
𝜇 : é a média global da resposta;
𝜏𝑖 : é o efeito do i-ésimo tratamento;
𝛽𝑗 : é o efeito do j-ésimo bloco;
𝜀𝑖𝑗 : é o efeito aleatório (𝑖 = 1, 2, … , 𝑛; 𝑗 = 1, 2, … , ℎ).
TESTE F PARA AMOSTRA EM BLOCOS
QUADRO ANOVA
A1 A2 A3
1 8,3 8,1 9,2
2 9,3 8,9 9,8
3 9,1 9,3 9,9
4 9,9 9,6 10,3
5 8,2 8,1 8,9
6 10,9 11,2 13,1
Soma 55,8 55,2 61,2
Média 9,3 9,2 10,2
Ex. 9.5(Barbetta, pg. 256)
Soma de Quadrados
55,8 2 + 55,2 2
+ (61,2)² 172,2 2
𝑆𝑄𝑇𝑟𝑎𝑡 = − = 3,64
6 18
2
5007,98 172,2
𝑆𝑄𝐵 = − = 21,95
3 18
172,2 2
2 2 2
𝑆𝑄𝑇𝑜𝑡 = 8,3 + 9,3 + 9,1 + ⋯ − = 26,86
18
Fonte de Variação SQ gl QM
Entre Trat. 3,64 2 1,82 14,29
Entre Blocos 21,95 5 4,39
Erro 1,27 10 0,13
Total 26,86 17
Onde:
• 𝜇 : é a média global da resposta;
• 𝜏𝑖 : é o efeito do i-ésimo nível do fator A;
• 𝛽𝑗 : é o efeito do j-ésimo nível do fator B;
• (𝜏𝛽)𝑖𝑗 : é o efeito da interação entre 𝜏𝑖 e 𝛽𝑗 ;
• 𝜀𝑖𝑗𝑘 : é o efeito aleatório ou erro experimental.
ANOVA EM PROJETOS FATORIAIS
• Notação para os dados:
ANOVA EM PROJETOS FATORIAIS
SOMAS DE QUADRADOS
• Somas das observações em cada célula:
𝑛
𝑦𝑖𝑗. = 𝑦𝑖𝑗𝑘
𝑘=1
𝑔 ℎ 2
𝑦𝑖𝑗. 𝑦…2
𝑆𝑄𝑆𝑢𝑏𝑡𝑜𝑡 = −
𝑛 𝑁
𝑖=1 𝑗=1
ANOVA EM PROJETOS FATORIAIS
Fonte de Soma de Quadrados gl Quadrados Razão f
Variação Médios
𝑔 𝑆𝑄𝐴 𝑄𝑀𝐴
Fator A 𝑦𝑖.2 𝑦…2 𝑔−1
𝑆𝑄𝐴 = − 𝑄𝑀𝐴 = 𝑓=
ℎ𝑛 𝑁 𝑔𝑙𝐴 𝑄𝑀𝐸𝑟𝑟𝑜
𝑖=1
31933,69
𝑆𝑄𝑇𝑜𝑡 = 1365,49 − = 34,92
24
10727,47 31933,69
𝑆𝑄𝐴 = − = 10,36
8 24
16052,65 31933,69
𝑆𝑄𝐵 = − = 7,15
12 24
EXEMPLO 9.6( Barbetta, pg. 260)
• ANOVA:
Fonte de Variação SQ gl QM 𝑓 𝑓𝑐
Total 34,92 23
EXEMPLO 9.6( Barbetta, pg. 260)
13
12
Retração Linear
11
10
6
30 35 40 45 50 55 60
Resistência Mecânica
CORRELAÇÃO
• EXEMPLO 11.1. Diagramas de dispersão:
Variável 𝑋1 (Retração Linear) e 𝑋3 (Absorção de
Água): Correlação entre Retração Linear e Absorção de Água
14
13
12
Retração Linear
11
10
0 2 4 6 8 10
Absorção de Água
CORRELAÇÃO
• EXEMPLO 11.1. Diagramas de dispersão:
Variável 𝑋2 (Resistência Mecânica) e 𝑋3 (Absorção
de Água):
Correlação entre Resistência Mecânica e Absorção de Água
60
55
Resistência Mecânica
50
45
40
35
30
0 2 4 6 8 10
Absorção de Água
CORRELAÇÃO
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑥𝑖′ = 𝑦𝑖′ =
𝑠𝑥 𝑠𝑦
(𝑖 = 1, 2, … , 𝑛)
CORRELAÇÃO
• Padronização (Exemplo 11.1 a, Barbetta, pg. 317):
CORRELAÇÃO
• Padronização (Exemplo 11.1 a, Barbetta, pg. 317):
CORRELAÇÃO
• Ideia de construção do Coef. De Correlação de
Pearson:
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑥𝑖′ = 𝑦𝑖′ = (𝑖 = 1, 2, … , 𝑛)
𝑠𝑥 𝑠𝑦
𝒙′
𝑥𝑖′ 𝑦𝑖′ ≈ 0
𝑖
CORRELAÇÃO
• Ideia de construção do Coef. De Correlação de
Pearson:
• Padronização: (𝑥𝑖 , 𝑦𝑖 ) (𝑥𝑖′ , 𝑦𝑖′ ):
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑥𝑖′ = 𝑦𝑖′ = (𝑖 = 1, 2, … , 𝑛)
𝑠𝑥 𝑠𝑦
• Coeficiente de correlação de Pearson:
𝑛 ′ ′
𝑖=1 𝑖 𝑦𝑖 )
(𝑥
𝑟=
𝑛−1
Valores possíveis de r e interpretação da
correlação
CORRELAÇÃO
• Exemplo 11.1, matriz de correlações:
𝑛 (𝑥𝑖 ∗ 𝑦𝑖 ) − ( 𝑥𝑖 )( 𝑦𝑖 )
𝑟=
𝑛 𝑥𝑖2 − 𝑥𝑖 2 ∗ 𝑛 𝑦𝑖2 − ( 𝑦𝑖 )2
CORRELAÇÃO
• Coeficiente de correlação populacional:
𝑋 − 𝜇𝑋 𝑌 − 𝜇𝑌
𝜌 = 𝐶𝑜𝑟𝑟 𝑋, 𝑌 = 𝐸 ∗
𝜎𝑋 𝜎𝑌
𝜇𝑋 = 𝐸 𝑋 𝜎𝑋 = 𝑉(𝑋)
𝜇𝑌 = 𝐸 𝑌 𝜎𝑌 = 𝑉(𝑌)
CORRELAÇÃO
• INFERÊNCIA SOBRE 𝜌:
85
Índice de Octanagem
2 81,6 84
3 82,1 83
82
4 83,7
81
5 83,9 80
0 1 2 3 4 5 6 7
6 85,0 Quantidade de Aditivo (%)
REGRESSÃO
• MODELO:
Regressão
𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑥𝑖 + 𝑒𝑖 Linear
Simples
• 𝛼 e 𝛽 são parâmetros;
REGRESSÃO
Modelo de regressão linear simples:
• Em termos das variáveis: 𝐸 𝑌 = 𝛼 + 𝛽𝑋;
• Suposições:
• os termos de erro (𝜀1 , 𝜀2 , … , 𝜀𝑛 ) são variáveis
aleatórias independentes;
• 𝐸 𝜀𝑖 = 0;
• 𝑉 𝜀𝑖 = 𝜎 2 ; e
• 𝜀𝑖 tem distribuição normal (𝑖 = 1, 2, … , 𝑛).
REGRESSÃO
• Método dos mínimos quadrados para estimar 𝛼 e
𝛽:
• Minimizar em relação a 𝛼 e 𝛽:
𝑆= 𝜀𝑖2 = 𝑌𝑖 − 𝛼 + 𝛽𝑥𝑖 ²
𝜕𝑆
• =0
𝜕𝛼
𝜕𝑆
• =0
𝜕𝛽
REGRESSÃO
• Método dos mínimos quadrados para estimar 𝛼 e
𝛽:
• Resultados das derivadas parciais:
Estimativa de 𝛽:
𝑛 𝑥𝑖 𝑦𝑖 − ( 𝑥𝑖 )( 𝑦𝑖 )
𝑏=
𝑛 𝑥𝑖2 − ( 𝑥𝑖 )²
Estimativa de 𝛼:
𝑦𝑖 − 𝑏 𝑥𝑖
𝑎=
𝑛
Reta de regressão construída com os dados:
𝑦 = 𝑎 + 𝑏𝑥
REGRESSÃO
• EXEMPLO NUMÉRICO:
𝒊 𝒙𝒊 𝒚𝒊 Diagrama de Dispersão
130
1 20 98 125
Tempo de Reação
120
2 25 110 115
110
105
3 30 112
100
95
4 35 115 90
15 20 25 30 35 40 45
Idade
5 40 122
REGRESSÃO
• EXEMPLO NUMÉRICO:
𝒊 𝒙𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒙𝒊 𝒚𝒊
1 20 98 400 1960
2 25 110 625 2750
3 30 112 900 3360
4 35 115 1225 4025
Reta de Regressão:
5 40 122 1600 4880
𝑦 =𝑎+𝑏∗𝑥
150 557 4750 16975
𝑛 𝑥𝑖 𝑦𝑖 − ( 𝑥𝑖 )( 𝑦𝑖 ) 𝑦𝑖 − 𝑏 𝑥𝑖
𝑏= 𝑎=
𝑛 𝑥𝑖2 − ( 𝑥𝑖 )² 𝑛
REGRESSÃO
• EXEMPLO NUMERICO:
𝒙𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒙𝒊 𝒚𝒊
𝑦𝑖 − 𝑏 𝑥𝑖
𝑎=
𝑛
557 − 1,06 ∗ 150
𝑎= = 79,6
5
REGRESSÃO
• EXEMPLO NUMÉRICO:
Reta de Regressão:
𝑦 =𝑎+𝑏∗𝑥
• 𝑎 = 79,6; 𝑏 = 1,06;
𝑦 = 79,6 + 1,06𝑥
𝑥 = 20 𝑦 = 100,8
𝑥 = 40 𝑦 = 122,0
REGRESSÃO
• EXEMPLO NUMÉRICO:
Diagrama de Dispersão
125
120
Tempo de Reação
115
110
105
100
95
90
15 20 25 30 35 40 45
Idade
REGRESSÃO
• QUALIDADE DO AJUSTE:
• Resíduos:
𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖
REGRESSÃO
• ANÁLISE DE VARIÂNCIA DO MODELO:
• Desvio em relação
a média aritmética:
𝑑𝑖 = 𝑦𝑖 − 𝑦
• Desvio em relação à
reta de regressão
(resíduo da
regressão):
𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖
REGRESSÃO
• SOMA DE QUADRADOS:
2 2 2
𝑦𝑖 − 𝑦 = 𝑦𝑖 − 𝑦 + 𝑦𝑖 − 𝑦𝑖
𝑆𝑄𝐸 = 𝑦𝑖 − 𝑦𝑖 2
= 𝑦𝑖2 − 𝑎 𝑦𝑖 − 𝑏 𝑥𝑖 𝑦𝑖
Coeficiente de Determinação:
2
𝑆𝑄𝑅 𝑆𝑄𝐸
𝑅 = =1−
𝑆𝑄𝑇 𝑆𝑄𝑇
REGRESSÃO
• Medidas de Qualidade do Ajuste:
Coeficiente de Determinação(R²):
𝑉𝑎𝑟𝑖𝑎çã𝑜
2 𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑦𝑖 − 𝑦 ²
𝑅 = =
𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑦𝑖 − 𝑦 ²
𝑇𝑜𝑡𝑎𝑙
Matematicamente, R² é o
0≤ 𝑅2 ≤1
quadrado do coeficiente
de correlação de Pearson.
REGRESSÃO
• Continuação Exemplo 11.2:
Y
85,5
85
Índice de Octanagem
84,5
84
83,5
83
82,5
82
y = 0,8857x + 79,7
81,5
R² = 0,975
81
80,5
80
0 1 2 3 4 5 6 7
Quantidade de Aditivo(%)
y de
Fonte gl SQ QM 𝑅𝑎𝑧ã𝑜 𝑓
Variação
𝑆𝑄𝑅 𝑄𝑀𝑅
Regressão 1 𝑆𝑄𝑅 = 𝑦𝑖 − 𝑦 ² 𝑄𝑀𝑅 = 𝑓=
1 𝑄𝑀𝐸
𝑆𝑄𝐸
Erro 𝑛−2 𝑆𝑄𝐸 = 𝑦𝑖 − 𝑦𝑖 ² 𝑄𝑀𝐸 =
𝑛−2
• H0: 𝛽 = 0 e H1: 𝛽 ≠ 0;
2
𝑆𝑄𝐸 = 80,50 − 80,59 + 81,60 − 81,47 + ⋯ = 0,35
13,73
𝑄𝑀𝑅 = = 13,73
1
0,35
𝑄𝑀𝐸 = = 0,088
4
13,73
𝑅𝑎𝑧ã𝑜 𝑓 = = 156,26
0,088
REGRESSÃO
• Exemplo 11.2:
Fonte de gl SQ QM 𝑅𝑎𝑧ã𝑜 𝑓
Variação
Total 5 14,08
REGRESSÃO
• Distribuição f com gl=1 e 4:
Amostra 𝑓
REGRESSÃO
• Abordagem clássica, regra de decisão:
𝑓 calculado:
Aceita H0 Rejeita H0
REGRESSÃO
• Suposições do Modelo:
𝑌𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
Onde:
• Os termos de erro ( 𝜀1 , 𝜀2 , … , 𝜀𝑛 ), são variáveis
aleatórias independentes;
• 𝐸 𝜀𝑖 = 0;
• 𝑉 𝜀𝑖 = 𝜎 2 ;
• 𝜀𝑖 tem distribuição normal (𝑖 = 1, 2, … , 𝑛).
REGRESSÃO
• Ilustração da verdadeira distribuição de
probabilidades em torno da verdadeira regressão:
REGRESSÃO
• Análise dos resíduos: é um diagnóstico das
suposições do modelo:
• Valores preditos:
• 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 ;
• Resíduos:
• 𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖 .
REGRESSÃO
• Análise dos Resíduos:
𝑙𝑜𝑔 𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑙𝑜𝑔 𝑥𝑖 + 𝜀𝑖
REGRESSÃO
• Análise dos Resíduos:
𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑙𝑜𝑔 𝑥𝑖 + 𝜀𝑖
REGRESSÃO
• Análise dos Resíduos:
𝑙𝑜𝑔 𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑥𝑖 + 𝜀𝑖
REGRESSÃO
Busca de um modelo adequado:
• Suposição de linearidade entre x e y: uso de
transformações;
• Suposição de variância constante: transformações
para estabilizar a variância ou uso do método dos
mínimos quadrados generalizados;
• Suposição de independência entre as
observações: transformações, uso do método dos
mínimos quadrados generalizados ou aplicação de
técnicas de séries temporais;
• Suposição de distribuição normal para os erros:
uso de transformações.
REGRESSÃO
• Modelos Linearizáveis:
𝑦 = 𝛼 + 𝛽 log 𝑋 𝑦 = 𝛼 + 𝛽 log 𝑥
REGRESSÃO
• Modelos Linearizáveis:
y com distribuição 𝑦′ = 𝑦
de Poisson