Inferência Estatística PDF

PROBABILIDADE E ESTATÍSTICA
INFERÊNCIA ESTATÍSTICA
Prof.ª Sheila Regina Oro

Projeto “Recursos Educacionais Digitais”
TESTE DE HIPÓTESES
POPULAÇÃO
Conjectura (hipótese), sobre o
comportamento das variáveis.
Decisão sobre
Amostra admissibilidade
da amostra.
Resultados Reais Obtidos

TESTE DE HIPÓTESES
• HIPÓTESE NULA:
É a hipótese aceita como verdadeira, até prova
estatística em contrário. Geralmente representa o
contrário do que queremos provar;
• HIPÓTESE ALTERNATIVA:
Geralmente é formulada em termos de
desigualdades, e comumente corresponde ao que se
quer provar.
TESTE DE HIPÓTESES
• As hipóteses podem ser:
a) Substituindo o processador A pelo
processador B, altera-se o tempo de resposta de um
computador;
H0: 𝜇𝐴 = 𝜇𝐵 e H1: 𝜇𝐴 ≠ 𝜇𝐵
b) Aumentando a dosagem de cimento,

aumenta-se a resistência do concreto;
H0: 𝜇2 = 𝜇1 e H1: 𝜇2 > 𝜇1.
TESTE DE HIPÓTESES
• a)H0: 𝜇𝐴 = 𝜇𝐵 e H1: 𝜇𝐴 ≠ 𝜇𝐵
Onde:
• 𝜇𝐴 é o tempo médio de resposta com o processador A;
e
• 𝜇𝐵 é o tempo médio de resposta com o processador B;
• b)H0: 𝜇2 = 𝜇1 e H1: 𝜇2 > 𝜇1

Onde:
• 𝜇2 é a resistência média do concreto com a dosagem
d2 de cimento; e
• 𝜇1 é a resistência média do concreto com a dosagem
d1 de cimento.
TESTE DE HIPÓTESES
c) Uma certa campanha publicitária produz
efeito positivo nas vendas;
H0: 𝜇2 = 𝜇1 e H1: 𝜇2 > 𝜇1 ;
d) A implementação de um programa de
melhoria da qualidade em uma empresa prestadora
de serviços melhora a satisfação de seus clientes;
H0: 𝑝2 = 𝑝1 e H1: 𝑝2 < 𝑝1 ;
TESTE DE HIPÓTESES
• As hipóteses podem ser colocadas em forma de
parâmetros populacionais:
a) A média dos tempos de resposta do
equipamento com o processador A é diferente da
média dos tempos de resposta com o processador B;
b) A média dos valores de resistência do

concreto com a dosagem de cimento é maior do que
a média dos valores de resistência com a dosagem .
TESTE DE HIPÓTESES
• Ex.:
Suspeita-se que uma moeda não seja
perfeitamente equilibrada (probab. de cara ≠ probab.
de coroa ≠ 0,5)
• 𝑝 = probabilidade de cara;
H0: 𝑝 = 0,5;
H1: 𝑝 ≠ 0,5.
NÍVEL DE SIGNIFICÂNCIA
Representa a probabilidade tolerável de se
rejeitar H0 quando esta for verdadeira.
Os valores mais comuns para o nível de

significância são 5%, 10% e 1%.
TESTE DE HIPÓTESES
• Planejamento da amostra:
lançamentos imparciais e independentes da
moeda.
Resultado da amostra:
Situação 1: Valor obtido: y = 10 caras.
• Hipóteses:
H0: a moeda é honesta;
H1: a moeda é viciada;
• Qual seria a conclusão?
TESTE DE HIPÓTESES
• Distribuição binomial:
Valor esperado , sob H0.

PROBABILIDADE DE SIGNIFICÂNCIA OU
VALOR-P
• Probabilidade da estatística do teste acusar um
resultado tão (ou mais) distante do esperado
quanto o resultado ocorrido na amostra observada,
supondo H0 como a hipótese verdadeira;
TESTE DE HIPÓTESES
• SITUAÇÃO 1:
Coroa Cara
Valor 𝑝 = 0,002 ou 2%
TESTE DE HIPÓTESES
• CONCLUSÃO:
Valor 𝑝 = 0,002 é menor que o nível de
significância, (probabilidade de uma moeda honesta
acusar um valor tão distante quanto ao que se
observou na amostra). Probabilidade muito
pequena!!!
• Qual é a conclusão?
O teste rejeita H0, ou seja, prova-se
estatisticamente que a moeda é viciada.
TESTE DE HIPÓTESES
• Situação 2:
Valor obtido: y = 7 caras.
• Qual seria a conclusão?

TESTE DE HIPÓTESES
TESTE DE HIPÓTESES
Valor 𝑝 = 0,344 maior que o nível de
significância, (probabilidade de uma moeda honesta
acusar um valor tão distante quanto ao que se
observou na amostra). Não é muito pequeno!!!
• Qual é a conclusão?
O teste aceita H0, ou seja, não se pode afirmar
que a moeda é viciada.
• REGRA DE DECISÃO:
Rejeita H0.( Aceita-se

𝑝≤𝛼 estatisticamente H1);
Aceita H0.(Os dados não

𝑝≤𝛼 mostram evidências para
aceitar H1).
• EXEMPLO
Para testar se existe diferença entre dois

sistemas computacionais (A e B), observou-se o
desempenho com 12 cargas de trabalho. Em 3 casos
o sistema A apresentou melhor desempenho do que
o B. Nos demais, o sistema B foi melhor. Qual a
conclusão ao nível de significância de 5%?
• RESPOSTAS:
Hipóteses:
H0: 𝑝 = 0,5;
H1: 𝑝 ≠ 0,5;
Onde:
• 𝑝 : probabilidade do sistema A apresentar melhor
desempenho que o sistema B.
• Distribuição Binomial: (𝑛 = 12; p = 0,5);
Valor esperado (𝜇) sob H0.

𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃{(𝑋 < 3) 𝑜𝑢 (𝑋 > 9)}:
𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 0,146 𝑜𝑢 14,6%

𝑉𝑎𝑙𝑜𝑟 − 𝑝 = 14,6 > 5% (𝛼 = 5%);
• O teste aceita H0, ao nível de significância de 5%.
Não se pode afirmar (ao nível de significância de 5%)

que existe diferença entre os dois tipos de sistemas,
em termos de desempenho.
TIPOS DE ERROS
TIPOS DE ERROS
ABORDAGEM CLÁSSICA:
Constrói a regra de decisão antes de observar a
amostra;
Retomando o experimento de lançar 10 vezes

a moeda, a regra de decisão para α = 0,05 é
construída com base na equação:
𝑃(𝑒𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝐻0 é 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎) = 𝛼 = 0,05

TIPOS DE ERROS
ABORDAGEM CLÁSSICA:
Regra de decisão em termos de Y = número
de caras em 10 lançamentos da moeda, com 𝛼
= 0,05.
Rejeita H0 Aceita H0 Rejeita H0

TESTES UNILATERAIS
• Mas, existem situações em que queremos rejeitar
H0 em apenas um dos sentido. Por exemplo, se
suspeitamos tende a dar mais caras do que
coroas. Neste caso o teste pode ser formulado da
seguinte maneira:
H0: 𝑝 = 0,5 (a moeda é honesta); e
H1: 𝑝 > 0,5 (a moeda tende a dar mais caras do que

coroas).
TESTES UNILATERAIS
𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑝(7) + 𝑝(8) + 𝑝(9) + 𝑝(10) = 0,172

TESTES PARA PROPORÇÃO
VARIÁVEIS DISCRETAS
• H0: 𝑝 = 𝑝0 e H1: 𝑝 ≠ 𝑝0 (𝑝0 é um valor dado);
• No caso de teste unilateral, a hipótese alternativa

seria H1’: 𝑝 > 𝑝0 (unilateral à direita) ou H1’’:𝑝 < 𝑝
(unilateral à esquerda).
• Suponha amostra suficientemente grande para

aproximação da binomial à normal:
𝑛. 𝑝0 ≥ 5 𝑒 𝑛. (1 – 𝑝0 ) ≥ 5.
• Sejam:
𝑦 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑐𝑜𝑚 𝑜 𝑎𝑡𝑟𝑖𝑏𝑢𝑡𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒

𝑝= =
𝑛 𝑛
𝑦’ = 𝑦– 0,5 𝑠𝑒 𝑦 > 𝑛. 𝑝0 ; ou
𝑦’ = 𝑦 + 0,5 𝑠𝑒 𝑦 < 𝑛. 𝑝0 (correção de continuidade).

Onde:
• 𝑝 : é a proporção de elementos com atributo de

interesse na amostra.
• Cálculo da estatística do teste:
𝑦 ′ − 𝑛. 𝑝0
𝑧=
𝑛. 𝑝0 (1 − 𝑝0 )
Onde:
• 𝑝0 : valor da proporção, segundo H0;
• 𝑛 : tamanho da amostra;
• 𝑦 ′ : correção de continuidade.
TESTE PARA PROPORÇÃO
ABORDAGEM DO VALOR -P
Obtenção de p
Amostra Cálculo de z pela tabela da
normal
𝑦 ′ − 𝑛. 𝑝0
𝑧=
𝑛. 𝑝0 (1 − 𝑝0 ) Se unilateral
Se bilateral: Se unilateral à à esquerda:
direita:
ABORDAGEM DO VALOR -P
Aceita H0
Rejeita H0
EXEMPLO 8.6 BARBETTA
• Uma empresa retira periodicamente amostras
aleatórias de 500 peças de sua linha de produção
para analise de qualidade. As peças da amostra
são classificadas como defeituosas ou não, sendo
que a politica da empresa exige que o processo
produtivo seja revisto se houver evidência de mais
que 1,5% de peças defeituosas. Na ultima amostra
foram encontradas 9 peças defeituosas. Usando
um nível de significância de 1%, o processo
precisa ser revisto?
RESULTADO
• H0: 𝑝 = 0,015; H1: 𝑝 > 0,015; Usar 𝛼 = 0,01;
• Amostra: 𝑦 = 9 em 𝑛 = 500;
9
𝑝= = 0,018
500
𝑦 ′ − 𝑛. 𝑝0 8,5 − 500 ∗ (0,015) 1

𝑧= = = ≈ 0,37
𝑛. 𝑝0 (1 − 𝑝0 ) 500 ∗ 0,015 ∗ (1 − 0,015) 2,718
RESULTADOS
Aceita-se H0 ao nível de significância de 1%.

ABORDAGEM CLÁSSICA
Nível de
significância α
Obtenção do valor
crítico
normal
pela tabela ...
ABORDAGEM CLÁSSICA
ABORDAGEM CLÁSSICA
Obtenção do
Nível de valor crítico pela Cálculo do
significância α tabela normal valor z
Se bilateral:
Rejeita H0 Aceita H0 RejeitaH0

ABORDAGEM CLÁSSICA
Obtenção do
Nível de Cálculo do
valor crítico pela
significância α valor z
tabela normal
Se unilateral a direita:
Aceita H0 Rejeita H0
EXEMPLO 8.6 BARBETTA
• H0: 𝑝 = 0,015; e H1: 𝑝 > 0,015. Usar α = 0,01
Regra de decisão:
RESULTADO
• Da amostra temos:
𝑦 ′ −𝑛.𝑝0
• 𝑧= = 0,37
𝑛.𝑝0 (1−𝑝0 )
Portanto, chegamos a conclusão de que não há

provas estatísticas suficientes para recomendar a
revisão do processo produtivo.
TESTE PARA MÉDIA
VARIÁVEIS CONTÍNUAS
• É aplicável em situações que queremos verificar se
uma variável na população pode ser considerada,
em média, igual a certo valor .
Para teste bilateral:
• H0: 𝜇 = 𝜇0 e H1: 𝜇 ≠ 𝜇0
• Para teste unilateral:

Para este caso a hipótese alternativa seria:
H1’: 𝜇 > 𝜇0 (unilateral à direita); ou
H1’’:𝜇 < 𝜇0 (unilateral à esquerda).
TESTE PARA MÉDIA
CASO DE VARIÂNCIA CONHECIDA
𝑥 − 𝜇0 ∗ 𝑛
𝑧=
𝜎
Onde:
• 𝑥 : média da amostra;
• 𝜇0 : valor da média segundo H0;
• 𝜎 : variância populacional;
O teste é feito com a distribuição normal,
análogo ao da proporção.
TESTE PARA MÉDIA
CASO DE VARIÂNCIA DESCONHECIDA
𝑥 − 𝜇0 ∗ 𝑛
𝑡=
𝑠
Onde:
• 𝑥 : média da amostra;
• 𝜇0 : valor da média segundo H0;
• 𝑠 : variância populacional.
Uso da distribuição t com 𝑔𝑙 = 𝑛 – 1 (supondo
população com distribuição normal).
EXEMPLO 8.8 (BARBETTA pg. 220)
• O tempo para transmitir 10 MB determinada rede de
computadores varia segundo um modelo normal, com
média 7,4 s e variância 1,3 s². Depois de algumas
mudanças na rede, acredita-se numa redução no
tempo de transmissão de dados, além de uma possível
alteração na variabilidade. Foram realizados 10 ensaios
independentes com um arquivo de 10 MB e foram
anotados os tempos de transmissão, em segundos: 6.8,
7.1, 5.9, 7.5, 6.3, 6.9, 7.2, 7.6, 6.6, 6.3;
• Existe evidência suficiente de que o tempo médio de
transmissão foi reduzido? Use nível de significância de
1%.
RESULTADOS
H0: 𝜇 = 7,4 𝑠;
H1: 𝜇 < 7,4 𝑠;
Amostra:
• N=10;
• Média da amostra=6,82;
• Desvio padrão da amostra=0,551;
6,82 − 7,4 ∗ 10
𝑡= = −3,33
0,551
RESULTADOS
• Uso da tabela t para obter o valor p:
RESULTADOS
• Uso da tabela t para obter o valor p:
RESULTADOS
Como observado na tabela t, a área apontada
é entre 0,0025 < 𝑣𝑎𝑙𝑜𝑟 𝑝 < 0,005 , então o teste
estatístico rejeita H0 em favor de H1.
Portanto, com este resultado, podemos afirmar

que houve redução no tempo de transmissão de
dados com as alterações nas redes de
computadores.
COMPARAÇÃO ENTRE TRATAMENTOS
AMOSTRAS INDEPENDENTES
Para realizar este tipo de experimento, divide-
se as unidades experimentais em g grupos,
submetendo cada grupo a um tratamento. Dessa
forma temos g amostras independentes.
Podemos construir também h blocos de

unidades experimentais semelhantes similares,
sorteando os tratamentos em cada bloco.
• Ex. 9.1(BARBETTA)
Considere o problema de comparar dois
materiais (A e B), para sola de tênis, em termos do
grau de desgaste após um certo período de uso.
Seguem dois projetos de experimentos alternativos:
• Projeto I – Um grupo de indivíduos usa tênis com

solas feitas com o material A; e outro grupo usa
tênis com solas feitas com o material B.
Mensuração do grau de Mensuração do grau de

desgaste desgaste
AMOSTRAS PAREADAS (se g>2)
• Projeto II – Fabricam-se, para a realização do
experimento, pares de tênis com os dois tipos de
sola, isto é, um dos pés com o material A e o outro
pé com o material B. Em cada par, o material
usado em cada pé (direito ou esquerdo) é decidido
por sorteio
Alocação aleatória de A e B em cada par;
Mensuração do grau de desgaste

AMOSTRAS PAREADAS
• Importância de considerar os pares na análise:
Indivíduo (par de unidades experimentais)

TESTE T PARA DUAS AMOSTRAS
• H0: 𝜇1 = 𝜇2 e H1: 𝜇1 ≠ 𝜇2 ;
Onde:
• 𝜇1 : valor esperado da resposta sob o tratamento 1;
• 𝜇2 : valor esperado da resposta sob o tratamento 2;
• Na abordagem unilateral, a hipótese alternativa é

do tipo:
• H1’: 𝜇1 > 𝜇2 ou H1”: 𝜇1 < 𝜇2 .
• Caso os dados na amostra possuam um nível de
mensuração qualitativo (ordinal ou nominal),
mensuração quantitativa com indícios de que a
distribuição não é normal ou quando há interesse
em realizar inferência sobre outras características
da população, usa-se os testes não paramétricos.
• No caso do teste t para duas amostras
independentes, o teste não paramétrico substituto
é o teste Mann-Whitney. Para duas amostras
pareadas o teste indicado é o de Wilcoxon.
EXEMPLO 9.2(Barbetta, pg 235)
• Seja o problema de verificar se um novo algoritmo
de busca em um banco de dados é mais rápido
que o algoritmo atualmente usado. Para se fazer a
comparação dos dois algoritmos, planeja-se
realizar uma amostra aleatória de 10 buscas
experimentais (ensaios). Em cada ensaio, uma
dada busca é realizada pelos dois algoritmos e o
tempo de resposta de cada algoritmo anotado.
Observamos que em cada ensaio os dois
algoritmos são usados em condições idênticas,
caracterizando 10 pares de observações.
EXEMPLO
• H0: em média, os dois algoritmos são igualmente
rápidos; e
• H1: em média, o algoritmo novo é mais rápido do
que o algoritmo em uso;
Ou:
• H0: 𝜇1 = 𝜇2 e H1: 𝜇1 < 𝜇2 ;
Onde:
• 𝜇2 é o tempo esperado de resposta do algoritmo
novo; e
• 𝜇1 é o tempo esperado de resposta do algoritmo
antigo.
EXEMPLO
EXEMPLO
• Como os dados são pareados, pode ser verificado
em cada ensaio a diferença entre os dois
tratamentos(algoritmo):
𝐷 = 𝑋2 − 𝑋1
• Em termos da variável diferença, as hipóteses

ficam:
• H0: 𝜇𝐷 = 0 e H1: 𝜇𝐷 > 0.

EXEMPLO
A estatística do teste será calculada da
seguinte maneira:
𝑑∗ 𝑛
𝑡=
𝑠𝑑
Onde:
• 𝑑 : é a média das diferenças observadas;
• 𝑛 : é o tamanho da amostra(número de pares);
• 𝑠𝑑 : é o desvio padrão das diferenças observadas.
EXEMPLO
• Supondo populações de distribuição normal, usa-
se a distribuição t de Student, com 𝑔𝑙 = 𝑛 − 1
graus de liberdade.
• Dos dados apresentados anteriormente temos:

Valores de D: 3, 7, -2, 6, -1, 6, 2, 9, -1, 5:
• 𝑑 = 3,4;
• 𝑛 = 10
1 246 − (10)(3,4)²
𝑠𝑑 = ∗ 𝑑𝑖2 −𝑛∗ 𝑑2 = = 3,81
𝑛−1 9
𝑖
EXEMPLO
A estatística fica da seguinte forma:
𝑑 ∗ 𝑛 3,4 ∗ 10
𝑡= = = 2,82
𝑠𝑑 3,81
Conferindo na tabela t com 𝑔𝑙 = 10 − 1 = 9:
EXEMPLO
• O valor calculado, 𝑡 = 2,82, está bem próximo de
2,821 apresentado na tabela de distribuição t, o
que nos fornece um valor para 𝑝 = 0,01 , menor
que o nível de significância adotado, de 5%(0,05).
• Portanto, podemos afirmar que o algoritmo de

busca novo é, em média, mais rápido que o antigo,
rejeitando assim H0: 𝜇𝐷 = 0.
INDEPENDENTES
Exemplo 9.3(Barbetta, pg 238)
Desejamos verificar se os catalisadores A e B
têm efeitos diferentes no rendimento de uma certa
reação química. As hipóteses são:
• H0: em média, os dois catalisadores são iguais em
termos de rendimento;
H0: 𝜇1 = 𝜇2 ; e
• H1: em média, os dois catalisadores são diferentes
em termos de rendimento.
H1: 𝜇1 ≠ 𝜇2 .
INDEPENDENTES
• Rendimentos (%) de uma reação química em
função do catalisador utilizado.
Catalisador A Catalisador B
45 42 45 45
51 53 35 41
50 50 43 43
62 48 59 49
43 55 48 39
INDEPENDENTES
• Diagrama de pontos dos resultados do
experimento:
INDEPENDENTES
• Estatística do teste:
2 2
2
𝑠1 + 𝑠2
𝑠𝑎 =
2
Onde:
• 𝑠12 : variância da amostra 1;
• 𝑠22 : variância da amostra 2;
• 𝑠𝑎2 : variância agregada das duas amostras.
INDEPENDENTES
• Estatística do teste:
𝑛
𝑡 = 𝑥1 − 𝑥2 ∗
2 ∗ 𝑠𝑎2
Onde:
• 𝑥1 : média da amostra 1;
• 𝑥2 : média da amostra 2;
• 𝑛 : tamanho da amostra em cada grupo.
INDEPENDENTES
• Usa-se para o cálculo a distribuição t de Student
com graus de liberdade (supondo populações com
distribuição normal).
• Continuação(ex. 9.3):
Amostra 1: 𝑛 = 10; 𝑥1 = 49,9; 𝑒 𝑠12 = 35,656;
Amostra 2: 𝑛 = 10; 𝑥2 = 44,7; 𝑒 𝑠22 = 42,233;
35,656+42,233
Variância Agregada: 𝑠𝑎2 = = 38,945;
2
10
𝑡 = 49,9 − 44,7 = 1,86
2 ∗ 38,94
INDEPENDENTES
Graus de Liberdade: 𝑔𝑙 = 2𝑛 − 2 = 2 ∗ 10 − 2 = 18;
Abordagem do valor p:
INDEPENDENTES
• O valor de t obtido pelo cálculo aponta para uma
região entre 0,025 e 0,05, mas como o teste é
bilateral, a área deve ser dobrada para se obter o
valor correto:
• Portanto, 0,05 < 𝑝 < 0,1 , aceitamos H0 ao nível

de significância de 5%, afirmando que os dados
não comprovam uma diferença entre os dois
catalisadores.
COMPARAÇÃO ENTRE VÁRIOS
TRATAMENTOS
• AMOSTRAS INDEPENDENTES:
A análise estatística para a comparação de g
grupos independentes é feita geralmente por análise
de variância ANOVA, acompanhada por um teste F,
que supõe:
• as observações devem ser independentes;
• as variâncias populacionais devem ser iguais nos g
grupos;
• a distribuição das observações em cada grupo
deve ser normal.
TRATAMENTOS
• Ex. 9.4(Barbetta, pg. 252)
Considere o problema de comparar 3 tipos de
rede de computadores, C1, C2 e C3, em termos do
tempo médio de transmissão de pacotes de dados
entre duas máquinas.
Experimento (projeto completamente

aleatorizado com um fator): 8 replicações com cada
tipo de rede, aleatorizando a ordem dos 24 ensaios e
mantendo fixos os demais fatores controláveis.
TRATAMENTOS
• Ex. 9.4;
• Projeto do experimento:
Seqüência número Uso da

dos testes do ensaio rede
1 16 C2
2 14 C2
3 24 C3
4 6 C1
... ... ...
24 11 C3
TRATAMENTOS
• Ex. 9.4;
Perguntas a serem respondidas pela análise
estatística:
• Existe diferença real (significativa) entre os 3 tipos

de rede?
• Qual é a estimativa do tempo de resposta para

cada tipo de rede?
TRATAMENTOS
• Ex. 9.4;
Hipóteses para o problema:
• H0: os tempos esperados de transmissão são

iguais para os três tipos de rede;
• H1: os tempos esperados de transmissão não são

todos iguais (dependem do tipo de rede);
TRATAMENTOS
• Dados do experimento:
Replicação Tipo de Rede
C1 C2 C3
1 7,2 7,8 6,3
2 9,3 8,2 6
3 8,7 7,1 5,3
4 8,9 8,6 5,1
5 7,6 8,7 6,2
6 7,2 8,2 5,2
7 8,8 7,1 7,2
8 8 7,8 6,8
Soma 65,7 63,5 48,1
Média 8,21 7,94 6,01
TRATAMENTOS
MODELO ANOVA: Tratameto
• 𝑔 = 3 𝑔𝑟𝑢𝑝𝑜𝑠; (1) (2) (3)
• 𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗
𝑦11 𝑦21 𝑦31
𝑦12 𝑦22 𝑦32

Onde:
• 𝑦𝑖𝑗 : observação; … … …
• 𝜇 : média global; 𝑦1𝑛 𝑦2𝑛 𝑦3𝑛 Média
• 𝜏𝑖 : efeito do tratamento i; Global
• 𝑒𝑖𝑗 : erro aleatório; Média 𝑦1. 𝑦2. 𝑦3. 𝑦..
• 𝜇𝑖 = 𝜇 + 𝜏𝑖 = média do fator i.
TRATAMENTOS
• HIPÓTESES:
H0: 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑔 = 0 ou 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑔 ;
H1: 𝜏𝑖 ≠ 0 ou 𝜇𝑖 ≠ 𝜇𝑗
As observações:
Sob H1: Sob H0:

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗 𝑦𝑖𝑗 = 𝜇 + 𝜇𝑖𝑗
TRATAMENTOS
• HIPÓTESES E MODELO SUBJACENTE:
𝐻0: 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑔 = 0
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗 𝑦𝑖𝑗 = 𝜇 + 𝜇𝑖𝑗
TRATAMENTOS
• HIPÓTESES E MODELO SUBJACENTE:
Sob H1: 𝜏𝑖 ≠ 0 para algum 𝑖:
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝑒𝑖𝑗
Análise de variância (ANOVA), com um fator
Soma de quadrados totais:
𝑔 𝑛
𝑆𝑄𝑇𝑜𝑡 = (𝑦𝑖𝑗 − 𝑦.. ) ²

𝑖=1 𝑗=𝑖
Onde:
• 𝑔 : grupos;
• 𝑛 : repetições;
Graus de Liberdade:
𝑔𝑙 = 𝑁 − 1
𝑁 =𝑛∗𝑔
Onde:
• 𝑁 : tratamentos;
Soma de Quadrados do Tratamento:
𝑔 𝑛 𝑔
𝑆𝑄𝑇𝑟𝑎𝑡 = 𝑦𝑖. − 𝑦.. 2 =𝑛 (𝑦𝑖. − 𝑦.. )²

𝑖=1 𝑗=1 𝑖=1
Onde:
• 𝑔 : grupos;
• 𝑛 : repetições
Graus de Liberdade:
𝑔𝑙 = 𝑔 − 1
• Soma de quadrados do erro:
𝑔 𝑛
𝑆𝑄𝐸𝑟𝑟𝑜 = (𝑦𝑖𝑗 − 𝑦𝑖. )²

𝑖=1 𝑗=1
Onde:
• 𝑔 : grupos;
• 𝑛 : repetições;
• Graus de liberdade:
𝑔𝑙 = 𝑁 − 𝑔
Onde:
• 𝑁 : tratamentos;
Fonte de Soma de Quadrados gl Quadrados Razão f

Variação Médios
𝑔 𝑆𝑄𝑇𝑟𝑎𝑡 𝑄𝑀𝑇𝑟𝑎𝑡
Entre 𝑦𝑖.2 𝑦..2 𝑔−1
𝑆𝑄𝑇𝑟𝑎𝑡 = − 𝑄𝑀𝑇𝑟𝑎𝑡 = 𝑓=
Tratamentos 𝑛 𝑁 𝑔𝑙 𝑇𝑟𝑎𝑡 𝑄𝑀𝐸𝑟𝑟𝑜
𝑖=1
Dentro Trat. 𝑁−𝑔 𝑆𝑄𝐸𝑟𝑟𝑜

𝑄𝑀𝐸𝑟𝑟𝑜 =
(Erro) 𝑆𝑄𝐸𝑟𝑟𝑜 = 𝑆𝑄𝑇𝑜𝑡 − 𝑆𝑄𝑇𝑟𝑎𝑡 𝑔𝑙𝐸𝑟𝑟𝑜
𝑔 𝑛
Total 𝑦 2
..
𝑁−1
2
𝑆𝑄𝑇𝑜𝑡 = 𝑦𝑖𝑗 −
𝑁
𝑖=1 𝑗=𝑖
TESTE F
• Se H0: 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑔 = 0 for verdadeira e
considerando as suposições anteriormente
enunciadas, a estatística f tem distribuição F com
(g - 1) graus de liberdade no numerador e (N - g)
graus de liberdade no denominador.
f
TESTE F
• Após calculada a estatística f, usa-se a tabela de
distribuição F de Snedecor, para encontrar (), com
graus de liberdade no numerador, e graus de
liberdade no denominador. A regra de decisão é
dada por:
• Se 𝑓 < 𝑓𝑐 , então aceita H0;
• Se 𝑓 ≥ 𝑓𝑐 , então rejeita H0;

Continuação Ex. 9.4
Soma global: 𝑦.. = 177,3;
𝑔 𝑛
2 2 2
𝑆𝑄: 𝑦𝑖𝑗 = 7,2 + 9,3 + ⋯ = 1344,25
𝑖=1 𝑗=1
67,6 2 + 63,5 2 + (48,1)² 177,3 2

𝑆𝑄𝑇𝑟𝑎𝑡 = − = 22,99
8 24
177,3 2
𝑆𝑄𝑇𝑜𝑡 = 1344,25 − = 34,45
24
𝑆𝑄𝐸𝑟𝑟𝑜 = 34,45 − 22,99 = 11,46

Continuação Ex. 9.4
Fonte de Variação SQ gl QM f
Entre Trat. 22,99 2 11,50 21,07

Dentro Trat. (Erro) 11,46 21 0,55
Total 34,45 23
REGRA DE DECISÃO
ABORDAGEM DO VALOR P
• Como regra de decisão, usa-se α=nível de
significância, usualmente 0,05(5%), que é
probabilidade tolerável de se rejeitar Ho quando
esta for verdadeira;
Rejeita H0 (Prova-
se estatisticamente
H1)
Aceita H0 (Dados
não mostram
evidências para
aceitar H1)
ANÁLISE DOS RESÍDUOS
• Avaliação das suposições da ANOVA através de
gráficos dos resíduos:
ESTIMAÇÃO DAS MÉDIAS
• Intervalo de confiança para o valor esperado da
resposta sob o i-ésimo tratamento (nível de conf.
𝛾):
𝑄𝑀𝐸𝑟𝑟𝑜
𝐼𝐶 𝜇𝑖 , 𝛾 = 𝑦𝑖. ± 𝑡𝛾
𝑛
Onde:
• 𝑡𝛾 : valor encontrado na tabela t;
• 𝛾 : nível de confiança;
ESTIMAÇÃO DAS MÉDIAS
• Ex. 9.4: Usando nível de confiança de 95% e 𝑔𝑙
= 𝑁 − 𝑔 = 24 − 3 = 21 , temos 𝑡95% = 2,08, então,
para a rede C1 temos:
0,55
𝐼𝐶 𝜇𝑖 , 95% = 8,21 ± 2,08 = 8,21 ± 0,55
8
ANOVA COM UM FATOR
• No caso em que as amostras não possuem

distribuição normal, ou que tenham um nível de
mensuração qualitativo, usa-se o teste Kruskal-
Wallis.
TESTE F PARA AMOSTRAS EM BLOCOS
• Notação para os dados:
TESTE F PARA AMOSTRAS EM BLOCOS
Modelo para os dados:
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + 𝜀𝑖𝑗
Onde:
𝜇 : é a média global da resposta;
𝜏𝑖 : é o efeito do i-ésimo tratamento;
𝛽𝑗 : é o efeito do j-ésimo bloco;
𝜀𝑖𝑗 : é o efeito aleatório (𝑖 = 1, 2, … , 𝑛; 𝑗 = 1, 2, … , ℎ).
TESTE F PARA AMOSTRA EM BLOCOS
QUADRO ANOVA

Variação Médios
𝑔 𝑆𝑄𝑇𝑟𝑎𝑡 𝑄𝑀𝑇𝑟𝑎𝑡
Entre
𝑆𝑄𝑇𝑟𝑎𝑡 =
𝑦𝑖.2 𝑦..2
−
𝑔−1 𝑄𝑀𝑇𝑟𝑎𝑡 =
𝑔𝑙 𝑇𝑟𝑎𝑡 𝑓=
Trat. ℎ 𝑁 𝑄𝑀𝐸
𝑖=1
ℎ 𝑆𝑄𝐵
Entre 𝑦.𝑗2 𝑦..2 ℎ−1 𝑄𝑀𝐵 =
𝑔𝑙𝐵
Blocos 𝑆𝑄𝐵𝑙𝑜𝑐𝑜 = −
𝑔 𝑁
𝑗=1
Erro 𝑆𝑄𝐸 = 𝑆𝑄𝑇𝑜𝑡 − 𝑆𝑄𝑇𝑟𝑎𝑡 − 𝑆𝑄𝐵 (𝑔 − 1)(ℎ − 1) 𝑆𝑄𝐸

𝑄𝑀𝑇𝑟𝑎𝑡 =
𝑔𝑙𝐸
𝑔 𝑛
Total
𝑆𝑄𝑇𝑜𝑡 = 2
𝑦𝑖𝑗 −
𝑦..2 𝑁−1
𝑁
𝑖=1 𝑗=𝑖
Ex. 9.5(Barbetta, pg. 256)
• Seja o problema de comparar 3 algoritmos de busca em
um banco dedados. Realiza-se um experimento com 6
buscas experimentais, sendo que em cada uma é
sorteado um número aleatório que indica o registro do
banco de dados a ser localizado. Em cada um dos 6
processos de busca, são usados separadamente os três
algoritmos em estudo, mas sob as mesmas condições,
em termos dos fatores controláveis. São anotados os
tempos de resposta ao usuário.
• Hipóteses:
H0: em média, os três algoritmos são igualmente rápidos;
H1: em média, os três algoritmos não são igualmente
rápidos;
• Dados do exercício:
Ensaio Algoritmos de Busca
(Bloco)
A1 A2 A3
1 8,3 8,1 9,2
2 9,3 8,9 9,8
3 9,1 9,3 9,9
4 9,9 9,6 10,3
5 8,2 8,1 8,9
6 10,9 11,2 13,1
Soma 55,8 55,2 61,2
Média 9,3 9,2 10,2
Soma de Quadrados
55,8 2 + 55,2 2
+ (61,2)² 172,2 2
𝑆𝑄𝑇𝑟𝑎𝑡 = − = 3,64
6 18
2
5007,98 172,2
𝑆𝑄𝐵 = − = 21,95
3 18
172,2 2
2 2 2
𝑆𝑄𝑇𝑜𝑡 = 8,3 + 9,3 + 9,1 + ⋯ − = 26,86
18
𝑆𝑄𝐸𝑟𝑟𝑜 = 26,86 − 21,95 − 3,64 = 1,27

Tabela ANOVA:
Fonte de Variação SQ gl QM
Entre Trat. 3,64 2 1,82 14,29
Entre Blocos 21,95 5 4,39
Erro 1,27 10 0,13
Total 26,86 17
Adotando 𝛼 = 0,05, com 𝑔𝑙 = 2 no numerador e 𝑔𝑙

= 10 no denominador, temos o valor crítico 𝑓𝑐 = 4,10.
O que podemos concluir?
• Como o valor calculado é superior ao valor crítico,
então o teste rejeita H0, provando estatisticamente
que há diferença entre os três algoritmos de busca
em termos do tempo médio de resposta.
ANOVA EM PROJETOS FATORIAIS
• Nos estudos experimentais, em geral procuramos
avaliar ou testar o efeito de mais de um fator sobre
uma resposta de interesse, por exemplo:
• O engenheiro civil quer conhecer o quanto o tempo
de hidratação, a dosagem de cimento e o uso de
aditivos interferem na resistência a compressão de
um concreto;
• Um projeto é dito fatorial quando cada nível de um
fator é testado com todos os níveis dos outros
fatores, sem restrições.
• As observações podem ser descritas pelo seguinte
modelo:
𝑌𝑖𝑗𝑘 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + (𝜏𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘
Onde:
• 𝜇 : é a média global da resposta;
• 𝜏𝑖 : é o efeito do i-ésimo nível do fator A;
• 𝛽𝑗 : é o efeito do j-ésimo nível do fator B;
• (𝜏𝛽)𝑖𝑗 : é o efeito da interação entre 𝜏𝑖 e 𝛽𝑗 ;
• 𝜀𝑖𝑗𝑘 : é o efeito aleatório ou erro experimental.
• Notação para os dados:
SOMAS DE QUADRADOS
• Somas das observações em cada célula:
𝑛
𝑦𝑖𝑗. = 𝑦𝑖𝑗𝑘
𝑘=1
• Soma de quadrados entre as células:
𝑔 ℎ 2
𝑦𝑖𝑗. 𝑦…2
𝑆𝑄𝑆𝑢𝑏𝑡𝑜𝑡 = −
𝑛 𝑁
𝑖=1 𝑗=1
Variação Médios
𝑔 𝑆𝑄𝐴 𝑄𝑀𝐴
Fator A 𝑦𝑖.2 𝑦…2 𝑔−1
𝑆𝑄𝐴 = − 𝑄𝑀𝐴 = 𝑓=
ℎ𝑛 𝑁 𝑔𝑙𝐴 𝑄𝑀𝐸𝑟𝑟𝑜
𝑖=1
Fator B ℎ 2 ℎ−1 𝑆𝑄𝐵 𝑄𝑀𝐵

𝑦.𝑗. 𝑦…2 𝑄𝑀𝐵 = 𝑓=
𝑆𝑄𝐵 = − 𝑔𝑙𝐵 𝑄𝑀𝐸𝑟𝑟𝑜
𝑔𝑛 𝑁
𝑗=1
Interação 𝑆𝑄𝐴𝐵 = 𝑔−1 ∗ 𝑆𝑄𝐴𝐵 𝑄𝑀𝐴𝐵

𝑄𝑀𝐴𝐵 = 𝑓=
A*B = 𝑆𝑄𝑆𝑢𝑏𝑡𝑜𝑡 − 𝑆𝑄𝐴 − 𝑆𝑄𝐵 ∗ (ℎ − 1) 𝑔𝑙𝐴𝐵 𝑄𝑀𝐸𝑟𝑟𝑜
Erro 𝑆𝑄𝐸𝑟𝑟𝑜 = 𝑆𝑄𝑇𝑜𝑡 − 𝑆𝑄𝑆𝑢𝑏𝑡𝑜𝑡 ℎ𝑔(𝑛 − 1) 𝑄𝑀𝐸𝑟𝑟𝑜 =

𝑆𝑄𝐸𝑟𝑟𝑜
=
𝑔𝑙𝐸𝑟𝑟𝑜
𝑔 ℎ 𝑛 𝑁−1
Total 𝑦…
2
2
𝑆𝑄𝑇𝑜𝑡 = 𝑦𝑖𝑗𝑘 −
𝑁
𝑖=1 𝑗=1 𝑘=1
EXEMPLO 9.6( Barbetta, pg. 260)
Considere o problema de comparar 3 topologias de
rede de computadores (C1, C2 e C3) e 2 protocolos (L1 e
L2), em termos do tempo de resposta ao usuário. Realizou-
se um experimento com 4 replicações em cada combinação
de topologia e protocolo. Deseja-se verificar se há diferenças
entre as topologias, entre os protocolos e eventual interação
entre topologia e protocolo. Então, quer-se testar as
seguintes hipóteses nulas:
(𝐴)
𝐻0 :os tempos esperados de resposta são iguais para as
três topologias;
(𝐵)
𝐻0 : os tempos esperados de resposta são iguais para os
dois protocolos;
(𝐴𝐵)
𝐻0 : a mudança de protocolo não altera as diferenças
médias do tempo de resposta nas três topologias (ausência
de interação).
• Dados do experimento:
Protocolo Topologia Soma Média
C1 C2 C3
L1 6,2 5,9 5,9 𝑦.1. = 82,8 7,45
7,6 8,4 6,2
7,2 7,1 5,2
8,8 7,1 7,2
L2 9,0 7,1 6,2 𝑦.2. = 95,9 7,99
8,9 8,6 6,1
9,4 9,1 8,9
8,0 7,8 6,8
Soma 𝑦1.. = 65,1 𝑦2.. = 61,1 𝑌3.. = 52,5 𝑦... = 178,7 7,45
Média 8,1375 7,6375 5,5625
5393,39 31933,69
𝑆𝑄𝑆𝑢𝑏𝑡𝑜𝑡 = − = 17,77
4 24
31933,69
𝑆𝑄𝑇𝑜𝑡 = 1365,49 − = 34,92
24
10727,47 31933,69
𝑆𝑄𝐴 = − = 10,36
8 24
16052,65 31933,69
𝑆𝑄𝐵 = − = 7,15
12 24
• ANOVA:
Fonte de Variação SQ gl QM 𝑓 𝑓𝑐
Topologia 10,36 2 5,18 5,44 3,55
Protocolo 7,15 1 7,15 7,51 4,41
Interação 0,26 2 0,13 0,14 3,55
Erro 17,14 18 0,95
Total 34,92 23
Conclui-se assim que tanto as diferentes

topologias C1, C2 e C3, (𝑓 = 5,44 > 𝑓𝑐 = 3,55) ,
quanto os diferentes protocolos utilizados L1 e L2, (𝑓
• Análise dos resíduos e do perfil das médias para
comprovar as suposições de normalidade e
variância constante dos dados.
• As médias são determinadas pela equação:
𝑛
1
𝑦𝑖𝑗. = 𝑦𝑖𝑗𝑘
𝑛
𝑘=1
• Os resíduos são a diferença entre os valores

observados e a média dos subgrupos:
𝑒𝑖𝑗𝑘 = 𝑦𝑖𝑗𝑘 − 𝑦𝑖𝑗.
(a) Perfil das médias (b) Análise dos Resíduos
Observando o perfil das médias podemos
observar diferenças entre os níveis dos dois fatores e
a ausência de interação.
Observando o perfil dos resíduos, observamos

que os resíduos se encontram distribuídos de forma
aleatória em torno da linha horizontal, associada ao
resíduo nulo, isso sugere também que as suposições
de normalidade e variância constantes são atendidas,
validando os resultados da ANOVA.
CORRELAÇÃO E REGRESSÃO
CORRELAÇÃO
• X e Y estão positivamente correlacionadas quando
elas caminham num mesmo sentido;
Ex. Quanto maior o nível de renda da população,

maior é a geração de resíduos;
• Estão negativamente correlacionadas quando elas

caminham em sentidos opostos;
Ex. Quanto menor a temperatura de um liquido,

maior é a presença de gases dissolvidos.
CORRELAÇÃO
• EXEMPLO 11.1 (BARBETTA, pg. 317):
No processo de queima da massa cerâmica

para pavimento, corpos de prova foram avaliados por
três variáveis: 𝑋1 = retração linear(%), 𝑋2 =
resistência mecânica(MPa), 𝑋3 = absorção de
água(%).
CORRELAÇÃO
• EXEMPLO 11.1. Resultados dos ensaios:
Ensaio 𝑋1 𝑋2 𝑋3 Ensaio 𝑋1 𝑋2 𝑋3
1 8,70 38,42 5,54 10 13,24 60,24 0,58
2 11,68 46,93 2,83 11 9,10 40,58 3,64
3 8,30 38,05 5,58 12 8,33 41,07 5,87
4 12,0 47,04 1,10 13 11,34 41,94 3,32
5 9,50 50,90 0,64 14 7,48 35,53 6,00
6 8,58 34,10 7,25 15 12,68 38,42 0,36
7 10,68 48,23 1,88 16 8,76 45,26 4,14
8 6,32 27,74 9,92 17 9,93 40,70 5,48
9 8,20 39,20 5,63 18 6,5 29,66 8,98
CORRELAÇÃO
• EXEMPLO 11.1. Diagramas de dispersão:
Variável 𝑋1 (Retração Linear) e 𝑋2 (Resistência
Mecânica):
Correlação entre Retração Linear e Resistência Mecânica
14
13
12
Retração Linear
11
10
6
30 35 40 45 50 55 60
Resistência Mecânica
CORRELAÇÃO
Variável 𝑋1 (Retração Linear) e 𝑋3 (Absorção de
Água): Correlação entre Retração Linear e Absorção de Água
14
13
12
Retração Linear
11
10
0 2 4 6 8 10
Absorção de Água
CORRELAÇÃO
Variável 𝑋2 (Resistência Mecânica) e 𝑋3 (Absorção
de Água):
Correlação entre Resistência Mecânica e Absorção de Água
60
55
Resistência Mecânica
50
45
40
35
30
0 2 4 6 8 10
Absorção de Água
CORRELAÇÃO
Ideia de construção do Coef. de Correlação de

Pearson:
Padronização: (𝑥 , 𝑦 )
𝑖 𝑖 (𝑥𝑖′ , 𝑦𝑖′ )
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑥𝑖′ = 𝑦𝑖′ =
𝑠𝑥 𝑠𝑦
(𝑖 = 1, 2, … , 𝑛)
CORRELAÇÃO
• Padronização (Exemplo 11.1 a, Barbetta, pg. 317):
CORRELAÇÃO
• Padronização (Exemplo 11.1 a, Barbetta, pg. 317):
CORRELAÇÃO
• Ideia de construção do Coef. De Correlação de
Pearson:
𝑥𝑖′ = 𝑦𝑖′ = (𝑖 = 1, 2, … , 𝑛)
𝑠𝑥 𝑠𝑦
• Considere os produtos dos valores padronizados:

′ ′
𝑥𝑖 , 𝑦𝑖
CORRELAÇÃO
• Sinais dos produtos dos valores padronizados:
𝒚′
Quadrantes com Quadrantes com
𝑥𝑖′ , 𝑦𝑖′ negativos 𝑥𝑖′ , 𝑦𝑖′ positivos
𝒙′

𝑥𝑖′ , 𝑦𝑖′ positivos 𝑥𝑖′ , 𝑦𝑖′ negativos
CORRELAÇÃO


𝑥𝑖′ 𝑦𝑖′ > 0

𝑖
CORRELAÇÃO

𝑥𝑖′ 𝑦𝑖′ < 0
𝑖
CORRELAÇÃO

𝑥𝑖′ 𝑦𝑖′ ≈ 0
𝑖
CORRELAÇÃO
• Ideia de construção do Coef. De Correlação de
Pearson:
• Padronização: (𝑥𝑖 , 𝑦𝑖 ) (𝑥𝑖′ , 𝑦𝑖′ ):
𝑥𝑖′ = 𝑦𝑖′ = (𝑖 = 1, 2, … , 𝑛)
𝑠𝑥 𝑠𝑦
• Coeficiente de correlação de Pearson:
𝑛 ′ ′
𝑖=1 𝑖 𝑦𝑖 )
(𝑥
𝑟=
𝑛−1
Valores possíveis de r e interpretação da
correlação
CORRELAÇÃO
• Exemplo 11.1, matriz de correlações:
Retração Resistência Absorção

Linear Mecânica de Água
Retração 1,00 0,75 -0,88
Linear
Resistência 0,75 1,00 -0,84
Mecânica
Absorção -0,88 -0,84 1,00
de Água
CORRELAÇÃO
• Interpretando a matriz de correlações, observamos

que entre resistência mecânica e retração linear
temos correlação positiva de moderada a forte, e
entre retração linear e absorção de água temos
correlação negativa forte.
CORRELAÇÃO
• Outra forma de calcular a correlação r:
𝑛 (𝑥𝑖 ∗ 𝑦𝑖 ) − ( 𝑥𝑖 )( 𝑦𝑖 )
𝑟=
𝑛 𝑥𝑖2 − 𝑥𝑖 2 ∗ 𝑛 𝑦𝑖2 − ( 𝑦𝑖 )2
CORRELAÇÃO
• Coeficiente de correlação populacional:
𝑋 − 𝜇𝑋 𝑌 − 𝜇𝑌
𝜌 = 𝐶𝑜𝑟𝑟 𝑋, 𝑌 = 𝐸 ∗
𝜎𝑋 𝜎𝑌
𝜇𝑋 = 𝐸 𝑋 𝜎𝑋 = 𝑉(𝑋)
𝜇𝑌 = 𝐸 𝑌 𝜎𝑌 = 𝑉(𝑌)
CORRELAÇÃO
• INFERÊNCIA SOBRE 𝜌:
Dada uma amostra aleatória simples

𝑋1 , 𝑌1 , 𝑋2 , 𝑌2 , … , (𝑋𝑛 , 𝑌𝑛 ) , do par de variáveis
aleatórias 𝑋, 𝑌 , o coeficiente r pode ser considerado
uma estimativa de 𝜌.
CORRELAÇÃO
• TESTE DE SIGNIFICÂNCIA DE 𝜌:
• H0: 𝜌 = 0 (as variáveis X e Y não são

correlacionadas);
• H1: 𝜌 ≠ 0 (as variáveis X e Y são correlacionadas;
(pode também ser unilateral);
• Admitindo (X, Y) com distribuição normal bivariada,

a Tabela 10 do Apêndice do livro Estatística para
Cursos de Engenharia e Informática (BARBETTA),
apresenta o valor absoluto mínimo de r para se
rejeitar H0.
REGRESSÃO
• REGRESSÃO LINEAR SIMPLES:
Variável independente Variável dependente
X Y
Temperatura do Resistência Mecânica da
Forno, ºC Cerâmica, Mpa
Quantidade de Octanagem
Aditivo, % da Gasolina
Renda, (R$) Consumo, (R$)
Memória RAM do Tempo de resposta
Computador, Gb do sistema, (s)
Área construída Preço do
do imóvel, m² imóvel, R$
REGRESSÃO
• Ex. 11.2, (Barbetta, pg. 325):
Considere o experimento que se analisa a
octanagem da gasolina (Y) em função da adição de
um novo aditivo (X). Para isso, foram realizados
ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de
aditivo. Os resultados são mostrados a seguir:
X Y Y
1 80,5 86
85
Índice de Octanagem
2 81,6 84
3 82,1 83
82
4 83,7
81
5 83,9 80
0 1 2 3 4 5 6 7
6 85,0 Quantidade de Aditivo (%)
REGRESSÃO
• MODELO:
𝑃𝑟𝑒𝑑𝑖𝑡𝑜 𝑝𝑜𝑟 𝑋, 𝐸𝑓𝑒𝑖𝑡𝑜

𝑌= +
𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝑢𝑚𝑎 𝑓𝑢𝑛çã𝑜 𝐴𝑙𝑒𝑎𝑡ó𝑟𝑖𝑜
Regressão
𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑥𝑖 + 𝑒𝑖 Linear
Simples
• 𝛼 e 𝛽 são parâmetros;
REGRESSÃO
Modelo de regressão linear simples:
• Em termos das variáveis: 𝐸 𝑌 = 𝛼 + 𝛽𝑋;
• Em termos dos dados: 𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑥𝑖 + 𝑒𝑖 ;
• Suposições:
• os termos de erro (𝜀1 , 𝜀2 , … , 𝜀𝑛 ) são variáveis
aleatórias independentes;
• 𝐸 𝜀𝑖 = 0;
• 𝑉 𝜀𝑖 = 𝜎 2 ; e
• 𝜀𝑖 tem distribuição normal (𝑖 = 1, 2, … , 𝑛).
REGRESSÃO
• Método dos mínimos quadrados para estimar 𝛼 e
𝛽:
• Minimizar em relação a 𝛼 e 𝛽:
𝑆= 𝜀𝑖2 = 𝑌𝑖 − 𝛼 + 𝛽𝑥𝑖 ²
𝜕𝑆
• =0
𝜕𝛼
𝜕𝑆
• =0
𝜕𝛽
REGRESSÃO
• Método dos mínimos quadrados para estimar 𝛼 e
𝛽:
• Resultados das derivadas parciais:
Estimativa de 𝛽:
𝑛 𝑥𝑖 𝑦𝑖 − ( 𝑥𝑖 )( 𝑦𝑖 )
𝑏=
𝑛 𝑥𝑖2 − ( 𝑥𝑖 )²
Estimativa de 𝛼:
𝑦𝑖 − 𝑏 𝑥𝑖
𝑎=
𝑛
Reta de regressão construída com os dados:
𝑦 = 𝑎 + 𝑏𝑥
REGRESSÃO
• EXEMPLO NUMÉRICO:
𝒊 𝒙𝒊 𝒚𝒊 Diagrama de Dispersão
130
1 20 98 125
Tempo de Reação
120
2 25 110 115
110
105
3 30 112
100
95
4 35 115 90
15 20 25 30 35 40 45
Idade
5 40 122
REGRESSÃO
𝒊 𝒙𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒙𝒊 𝒚𝒊
1 20 98 400 1960
2 25 110 625 2750
3 30 112 900 3360
4 35 115 1225 4025
Reta de Regressão:
5 40 122 1600 4880
𝑦 =𝑎+𝑏∗𝑥
150 557 4750 16975
𝑛 𝑥𝑖 𝑦𝑖 − ( 𝑥𝑖 )( 𝑦𝑖 ) 𝑦𝑖 − 𝑏 𝑥𝑖
𝑏= 𝑎=
𝑛 𝑥𝑖2 − ( 𝑥𝑖 )² 𝑛
REGRESSÃO
• EXEMPLO NUMERICO:
𝒙𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒙𝒊 𝒚𝒊
150 557 4750 16975

𝑛 𝑥𝑖 𝑦𝑖 − ( 𝑥𝑖 )( 𝑦𝑖 )
𝑏=
𝑛 𝑥𝑖2 − ( 𝑥𝑖 )²
5 ∗ 16975 − (150 ∗ 557)

𝑏= = 1,06
5 ∗ 4750 − (150)²
REGRESSÃO
𝑦𝑖 − 𝑏 𝑥𝑖
𝑎=
𝑛
557 − 1,06 ∗ 150
𝑎= = 79,6
5
REGRESSÃO
Reta de Regressão:
𝑦 =𝑎+𝑏∗𝑥
• 𝑎 = 79,6; 𝑏 = 1,06;
𝑦 = 79,6 + 1,06𝑥
𝑥 = 20 𝑦 = 100,8
𝑥 = 40 𝑦 = 122,0
REGRESSÃO
Diagrama de Dispersão
125
120
Tempo de Reação
115
110
105
100
95
90
15 20 25 30 35 40 45
Idade
REGRESSÃO
• QUALIDADE DO AJUSTE:
Após determinada a reta de regressão, deve-

se verificar a qualidade do ajuste do modelo, que
pode ser feito por:
• Análise de variância do modelo;
• Análise dos resíduos;

REGRESSÃO
• RETA DE REGRESSÃO E RESÍDUOS:
• Valores preditos:
𝑦𝑖 = 𝑎 + 𝑏 ∗ 𝑥𝑖
• Resíduos:
𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖
REGRESSÃO
• ANÁLISE DE VARIÂNCIA DO MODELO:
• Desvio em relação
a média aritmética:
𝑑𝑖 = 𝑦𝑖 − 𝑦
• Desvio em relação à
reta de regressão
(resíduo da
regressão):
𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖
REGRESSÃO
• SOMA DE QUADRADOS:
2 2 2
𝑦𝑖 − 𝑦 = 𝑦𝑖 − 𝑦 + 𝑦𝑖 − 𝑦𝑖
SQT SQR SQE

Variação total Variação explicada Variação não
pela equação de explicada
regressão.
REGRESSÃO
• SOMA DE QUADRADOS:
𝑦𝑖 ²
𝑆𝑄𝑇 = 𝑦𝑖 − 𝑦 ² = 𝑦𝑖2 −
𝑛
𝑆𝑄𝐸 = 𝑦𝑖 − 𝑦𝑖 2
= 𝑦𝑖2 − 𝑎 𝑦𝑖 − 𝑏 𝑥𝑖 𝑦𝑖
𝑆𝑄𝑅 = 𝑆𝑄𝑇 − 𝑆𝑄𝐸
Coeficiente de Determinação:
2
𝑆𝑄𝑅 𝑆𝑄𝐸
𝑅 = =1−
𝑆𝑄𝑇 𝑆𝑄𝑇
REGRESSÃO
• Medidas de Qualidade do Ajuste:
Coeficiente de Determinação(R²):
𝑉𝑎𝑟𝑖𝑎çã𝑜
2 𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑦𝑖 − 𝑦 ²
𝑅 = =
𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑦𝑖 − 𝑦 ²
𝑇𝑜𝑡𝑎𝑙
Matematicamente, R² é o
0≤ 𝑅2 ≤1
quadrado do coeficiente
de correlação de Pearson.
REGRESSÃO
• Continuação Exemplo 11.2:
Y
85,5
85
Índice de Octanagem
84,5
84
83,5
83
82,5
82
y = 0,8857x + 79,7
81,5
R² = 0,975
81
80,5
80
0 1 2 3 4 5 6 7
Quantidade de Aditivo(%)
• O que pode-se concluir sobre a equação de

regressão?
REGRESSÃO
• Continuação Exemplo 11.2:
• A equação de regressão afirma que 97,5% do
índice de octanagem pode ser explicado por uma
relação linear com a quantidade de aditivos.
REGRESSÃO
• Análise de Variância do Modelo:
y de
Fonte gl SQ QM 𝑅𝑎𝑧ã𝑜 𝑓
Variação
𝑆𝑄𝑅 𝑄𝑀𝑅
Regressão 1 𝑆𝑄𝑅 = 𝑦𝑖 − 𝑦 ² 𝑄𝑀𝑅 = 𝑓=
1 𝑄𝑀𝐸
𝑆𝑄𝐸
Erro 𝑛−2 𝑆𝑄𝐸 = 𝑦𝑖 − 𝑦𝑖 ² 𝑄𝑀𝐸 =
𝑛−2
Total 𝑛−1 𝑆𝑄𝑇 = 𝑦𝑖 − 𝑦 ²

REGRESSÃO
• Teste de Significância do Modelo:
𝐸 𝑌 =𝛼+𝛽∗𝑋
• H0: 𝛽 = 0 e H1: 𝛽 ≠ 0;
• Distribuição de frequência para a razão 𝑓 :

distribuição 𝑓 com 𝑔𝑙 = 1 no numerador e 𝑔𝑙 = 𝑛
− 2 no denominador. (Usar Tabela 6 do apêndice
do Livro Barbetta, citado nas referências).
REGRESSÃO
• Exemplo 11.2:
𝑆𝑄𝑅 = 80,59 − 82,80 2 + 81,47 − 82,80 2 + ⋯ = 13,73
𝑆𝑄𝑇 = 80,50 − 82,80 + 81,60 − 82,80 + ⋯ = 14,08
2
𝑆𝑄𝐸 = 80,50 − 80,59 + 81,60 − 81,47 + ⋯ = 0,35
13,73
𝑄𝑀𝑅 = = 13,73
1
0,35
𝑄𝑀𝐸 = = 0,088
4
13,73
𝑅𝑎𝑧ã𝑜 𝑓 = = 156,26
0,088
REGRESSÃO
• Exemplo 11.2:
Fonte de gl SQ QM 𝑅𝑎𝑧ã𝑜 𝑓
Variação
Regressão 1 13,73 13,73 156,26
Erro 4 0,35 0,088
Total 5 14,08
REGRESSÃO
• Distribuição f com gl=1 e 4:
Possíveis valores de f, sob H0.

REGRESSÃO
• Valor p na distribuição F:
Amostra 𝑓
REGRESSÃO
• Abordagem clássica, regra de decisão:
𝑓 calculado:
REGRESSÃO
• Suposições do Modelo:
𝑌𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
Onde:
• Os termos de erro ( 𝜀1 , 𝜀2 , … , 𝜀𝑛 ), são variáveis
aleatórias independentes;
• 𝐸 𝜀𝑖 = 0;
• 𝑉 𝜀𝑖 = 𝜎 2 ;
• 𝜀𝑖 tem distribuição normal (𝑖 = 1, 2, … , 𝑛).
REGRESSÃO
• Ilustração da verdadeira distribuição de
probabilidades em torno da verdadeira regressão:
REGRESSÃO
• Análise dos resíduos: é um diagnóstico das
suposições do modelo:
• Valores preditos:
• 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 ;
• Resíduos:
• 𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖 .
REGRESSÃO
• Análise dos Resíduos:
Gráfico dos dados Gráfico dos Resíduos

(𝑥𝑖 , 𝑦𝑖 ) (𝑥𝑖 , 𝑒𝑖 )
As suposições do modelo parecem satisfeitas?

REGRESSÃO
• Pode-se perceber que nos gráficos anteriores não

há nenhum ponto discrepante no gráfico dos
dados, nota-se também que os resíduos possuem
média aproximadamente zero, comprovando as
suposições do modelo.
REGRESSÃO

(𝑥𝑖 , 𝑦𝑖 ) (𝑥𝑖 , 𝑒𝑖 )

REGRESSÃO
Um ponto discrepante nos dados pode forçar
uma inclinação da reta, sugerindo uma tendência não
compatível com as demais observações.
Geralmente ocorre em amostras com poucas
observações.
É necessário, nesse caso, buscar a razão
deste ponto discrepante, que pode ser algum erro,
alguma falha no experimento, ou pode ser
considerada uma situação atípica, sendo necessário
uma nova análise, sem esse ponto discrepante.
REGRESSÃO

(𝑥𝑖 , 𝑦𝑖 ) (𝑥𝑖 , 𝑒𝑖 )

REGRESSÃO
• No caso anterior, recomenda-se a aplicação da
transformação logarítmica, tanto para os valores
de X quanto para os valores de Y, estabelecendo o
seguinte modelo:
𝑙𝑜𝑔 𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑙𝑜𝑔 𝑥𝑖 + 𝜀𝑖
REGRESSÃO
Gráfico dos Resíduos

(𝑥𝑖 , 𝑒𝑖 )

REGRESSÃO
• O gráfico anterior apresenta uma relação não
linear, em que Y crescendo rapidamente com
valores pequenos de X e crescendo lentamente
com valores grandes de X.
• Situação típica onde se transforma somente os
dados da variável X, considerando o seguinte
modelo para os dados:
𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑙𝑜𝑔 𝑥𝑖 + 𝜀𝑖
REGRESSÃO

(𝑥𝑖 , 𝑦𝑖 ) (𝑥𝑖 , 𝑒𝑖 )

REGRESSÃO
• Os gráficos anteriores sugerem os seguintes
problemas: relação não linear e aumento da
variância a medida que X aumenta. Nesse caso, é
recomendado uma transformação logarítmica na
variável Y, ajustando o seguinte modelo aos dados:
𝑙𝑜𝑔 𝑦𝑖 = 𝛼 + 𝛽 ∗ 𝑥𝑖 + 𝜀𝑖
REGRESSÃO
Busca de um modelo adequado:
• Suposição de linearidade entre x e y: uso de
transformações;
• Suposição de variância constante: transformações
para estabilizar a variância ou uso do método dos
mínimos quadrados generalizados;
• Suposição de independência entre as
observações: transformações, uso do método dos
mínimos quadrados generalizados ou aplicação de
técnicas de séries temporais;
• Suposição de distribuição normal para os erros:
uso de transformações.
REGRESSÃO
• Modelos Linearizáveis:
𝑦 = 𝛼 + 𝛽 log 𝑋 𝑦 = 𝛼 + 𝛽 log 𝑥
REGRESSÃO
• Modelos Linearizáveis:
𝑦 = 𝛼 ∗ 𝛽𝑥 𝑙𝑜𝑔 𝑦 = 𝑙𝑜𝑔 𝛼 + log 𝛽 ∗ 𝑥

REGRESSÃO
• Transformações para estabilizar a variância:
REGRESSÃO
Alguns resultados teóricos;
y com distribuição 𝑦′ = 𝑦
de Poisson
y com distribuição 𝑦 ′ = 𝑠𝑒𝑛−1 𝑦

de Binomial
REGRESSÃO
Se o desvio padrão de y aumenta

proporcionalmente em relação ao 𝑦 ′ = 𝑙𝑜𝑔 𝑦
valor esperado de y
REFERÊNCIAS
• BARBETTA, Pedro A.; REIS, Marcelo. M.;
BORNIA, Antonio C. Estatística para cursos de
engenharia e informática. 3 ed. São Paulo:
Editora Atlas, 2010.

Inferência Estatística PDF

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Inferência Estatística PDF

Enviado por

Direitos autorais:

Formatos disponíveis

PROBABILIDADE E ESTATÍSTICA

Prof.ª Sheila Regina Oro

Resultados Reais Obtidos

b) Aumentando a dosagem de cimento,

• b)H0: 𝜇2 = 𝜇1 e H1: 𝜇2 > 𝜇1

b) A média dos valores de resistência do

Os valores mais comuns para o nível de

Valor esperado , sob H0.

• Qual seria a conclusão?

Rejeita H0.( Aceita-se

Aceita H0.(Os dados não

Para testar se existe diferença entre dois

Valor esperado (𝜇) sob H0.

𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 0,146 𝑜𝑢 14,6%

• O teste aceita H0, ao nível de significância de 5%.

Não se pode afirmar (ao nível de significância de 5%)

Retomando o experimento de lançar 10 vezes

𝑃(𝑒𝑟𝑟𝑜 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝐻0 é 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎) = 𝛼 = 0,05

Rejeita H0 Aceita H0 Rejeita H0

H0: 𝑝 = 0,5 (a moeda é honesta); e

H1: 𝑝 > 0,5 (a moeda tende a dar mais caras do que

𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑝(7) + 𝑝(8) + 𝑝(9) + 𝑝(10) = 0,172

• No caso de teste unilateral, a hipótese alternativa

• Suponha amostra suficientemente grande para

𝑦 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑐𝑜𝑚 𝑜 𝑎𝑡𝑟𝑖𝑏𝑢𝑡𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑒𝑠𝑠𝑒

𝑦’ = 𝑦 + 0,5 𝑠𝑒 𝑦 < 𝑛. 𝑝0 (correção de continuidade).

• 𝑝 : é a proporção de elementos com atributo de

𝑦 ′ − 𝑛. 𝑝0 8,5 − 500 ∗ (0,015) 1

Aceita-se H0 ao nível de significância de 1%.

Rejeita H0 Aceita H0 RejeitaH0

Portanto, chegamos a conclusão de que não há

• Para teste unilateral:

Portanto, com este resultado, podemos afirmar

Podemos construir também h blocos de

• Projeto I – Um grupo de indivíduos usa tênis com

Mensuração do grau de Mensuração do grau de

Mensuração do grau de desgaste

Indivíduo (par de unidades experimentais)

• Na abordagem unilateral, a hipótese alternativa é

• Em termos da variável diferença, as hipóteses

• H0: 𝜇𝐷 = 0 e H1: 𝜇𝐷 > 0.

• Dos dados apresentados anteriormente temos:

• Portanto, podemos afirmar que o algoritmo de

Amostra 2: 𝑛 = 10; 𝑥2 = 44,7; 𝑒 𝑠22 = 42,233;

• Portanto, 0,05 < 𝑝 < 0,1 , aceitamos H0 ao nível

Experimento (projeto completamente

Seqüência número Uso da

• Existe diferença real (significativa) entre os 3 tipos

• Qual é a estimativa do tempo de resposta para

• H0: os tempos esperados de transmissão são

• H1: os tempos esperados de transmissão não são

𝑦12 𝑦22 𝑦32

Sob H1: Sob H0:

𝑆𝑄𝑇𝑜𝑡 = (𝑦𝑖𝑗 − 𝑦.. ) ²

𝑆𝑄𝑇𝑟𝑎𝑡 = 𝑦𝑖. − 𝑦.. 2 =𝑛 (𝑦𝑖. − 𝑦.. )²

𝑆𝑄𝐸𝑟𝑟𝑜 = (𝑦𝑖𝑗 − 𝑦𝑖. )²

Fonte de Soma de Quadrados gl Quadrados Razão f

Dentro Trat. 𝑁−𝑔 𝑆𝑄𝐸𝑟𝑟𝑜

• Se 𝑓 < 𝑓𝑐 , então aceita H0;

• Se 𝑓 ≥ 𝑓𝑐 , então rejeita H0;

67,6 2 + 63,5 2 + (48,1)² 177,3 2

𝑆𝑄𝐸𝑟𝑟𝑜 = 34,45 − 22,99 = 11,46