Escolar Documentos
Profissional Documentos
Cultura Documentos
REGRESSÃO LINEAR
Autor(a): Guilherme Augusto Pianezzer
Teste de Hipótese
A Figura 4.1 apresenta o tipo de modelo investigado. Aqui, gostaríamos de
encontrar como a variável independente está associada aos possíveis valores
que a variável dependente assume.
F = −k. Δ
X,
Essas medidas podem ser descritas a partir de uma tabela. No exemplo que
discutiremos neste estudo, consideramos os dados descritos na Tabela 4.1.
Deslocamento versus força Força versus deslocamento
Observação F (N ) Observação
Δ
x (cm) Δ
x (cm) F (N )
y = α + β. x + ϵi , i = 1, … , n
y = α + β. x.
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Um recorte da tabela 4.1 analisada nos mostra que várias medidas foram
realizadas para o deslocamento da mola, resultando em diversas forças
diferentes.
Deslocamento versus força
F (N )
Observação Δ
x (cm)
1 220 122
2 220 119
3 220 122
4 220 122
5 220 122
a) 119 N.
b) 120 N.
c) 120,5 N.
d) 121,4 N.
e) 122 N.
Estimação dos
Parâmetros do
Modelo
Perceba que o nosso objetivo é determinar a melhor reta para esse conjunto de
pontos. Para isso, os parâmetros dele envolvidos são o coeficiente angular e o
coeficiente linear dele. Assim, vejamos com cuidado como selecionar os
devidos valores dele dentre as infinitas possibilidades. Segundo Morettin (2010,
p. 452), encontramos os “estimadores de mínimos quadrados para os
parâmetros do modelo linear, mas o mesmo desenvolvimento pode ser
aplicado em modelos mais complexos”.
ϵi = y − (α + β. xi ) .
i
Como y
i
representa o valor observado e α + β. xi representa o valor
estimado pela regressão, verificamos que ei representa o quão afastada a
estimativa está do valor observado (i.e. medido).
2 2
SQE = ∑ ϵ = ∑ [y − (α + β. xi ]
i i
i=1 i=1
∂
SQE = 0
∂α
{
∂
SQE = 0
∂β
n n
∑ y = ∑ [α + β. xi ]
i=1 i i=1
{
n n
∑ y xi = ∑ [(α + β. xi ) . xi ]
i=1 i i=1
Mesmo com tanta equação para ser analisada, você deve se atentar à
importância dela e aos pré-requisitos necessários à análise correta desse
material. Vejamos, na seção Saiba Mais, uma sugestão de estudo para essa
temática.
SAIBA MAIS
n n
1 1
x̄ = ∑ xi , ȳ = ∑y
i
n n
i=1 i=1
Assim, reescrevemos:
n n
∑ y = nα + β. ∑ xi
i=1 i i=1
{
n n n 2
∑ xi y = α. ∑ xi + β. ∑ x
i=1 i i=1 i=1 i
n n
1
α = [∑ y − β. ∑ xi ]
i
n
i=1 i=1
n n n n n
1
2
∑ xi y = [∑ y − β. ∑ xi ] . ∑ xi + β. ∑ x
i i i
n
i=1 i=1 i=1 i=1 i=1
Multiplicando por n:
n n n n n
2
n. ∑ xi y = [∑ y − β. ∑ xi ] . ∑ xi + βn. ∑ x
i i i
Assim,
n n n
n. ∑ xi y − ∑ xi . ∑ y
i=1 i i=1 i=1 i
β =
n 2 n 2
n. ∑ x − (∑ xi )
i=1 i i=1
Substituindo o termo β na expressão de α , podemos encontrar:
n n
1
α = [∑ y − β. ∑ xi ] =
i
n
i=1 i=1
n n n n n
1 n. ∑ xi y − ∑ xi . ∑ y
i=1 i i=1 i=1 i
[∑ y − [ ] . ∑ xi ]
i 2
n n
n 2
i=1 n. ∑ x − (∑ xi ) i=1
i=1 i i=1
y
^ = α + βx
^
α = ȳ − βx̄
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Observação Observação
Δ
x (cm) F (N ) Δ
x (cm)
F (N )
Com base nas equações desenvolvidas nessa seção, marque a alternativa que
apresenta o valor correto de α e β.
a) α = 1, 032; β = 105, 38
b) α = 227, 5; β = 129, 4
c) α = 129, 4; β = 227, 5
e) α = 1, 032; β = 0
Correlação
Embora tenhamos encontrado uma reta que descreve, de certa forma, esse
conjunto de dados, você deve perceber que esse método não tem nenhuma
restrição significativa, de forma que pode ser aplicado em, praticamente,
qualquer conjunto de dados numéricos. Entretanto nem todos os fenômenos se
comportam de forma linear, de maneira que o uso desse método de forma
irrestrita pode nos levar a erros sérios. Quando os dados estão fortemente
ajustados pela reta, o índice de correlação linear nos indica esse resultado
mostrando que o método está adequado para esse caso. E aí, nesse caso,
podemos seguir a instrução de Morettin (2010, p. 465), “o modelo linear,
estudado até agora, será utilizado frequentemente para fazer previsões da
variável resposta, y, para algum nível da variável de controle, x.”
F = α + β. Δ
x
Como temos a suposição de que tal experimento atende à Lei de Hooke (i.e.,
F = −k. Δ
x), caso os dados do experimento se comportem como uma reta,
poderemos afirmar que o coeficiente de elasticidade, k, será determinado por
β .
1 x1 y1 x1 y 1 x21
2 x2 y2 x2 y 2 x22
n X xn yn xn y n x2n
n n n n 2
∑ ∑ xi ∑ yi ∑ xi y i ∑ x .
i=1 i=1 i=1 i=1 i
ni xi yi x i . yi Xi2
2
ni xi yi xi . y i x
i
Tabela 4.4 — Tabela com auxílio para cálculos manuais para os dados do exemplo
Fonte: Elaborada pelo autor.
Como
∑ xi 4.550
x̄ = = = 227, 5
n 20
∑y 2588
i
ȳ = = = 129, 4
n 20
Então,
ȳ = α + βx̄
α = βx̄ − ȳ = 105, 38
Perceba que essa técnica permitirá que você determine relações lineares entre
duas variáveis, mas essa operação poderá ser realizada na maior parte dos
dados numéricos. Agora, para verificar que o método pode ser usado e que nos
dará um bom resultado, verificaremos o coeficiente de correlação. Antes disso,
discutiremos o intervalo de confiança na atividade prática.
praticar
Vamos Praticar
Sempre que tratamos de dados estatísticos, seja encontrando um certo
parâmetro, como acabamos de fazer com o coeficiente de elasticidade, ou
seja aplicando uma variedade de métodos, devemos ter em mente que o
valor real pertence a um determinado intervalo de confiança. Nunca será um
número absoluto. Podemos provar que o intervalo de confiança para esse
parâmetro é dado por:
−−−−−−−−−−−− −−−−−−−−−−−−
QM E QM E
β − t α √ ≤ β ≤ β + t α √
(1− ,n−2) n 2 (1− ,n−2) n 2
2
∑ (x i − x̄ ) 2
∑ (x i − x̄ )
i=1 i=1
Com base no problema discutido ao longo deste estudo, consulte uma tabela
de distribuição para encontrar o intervalo de confiança para o coeficiente de
elasticidade e determine o intervalo de confiança para o coeficiente de
elasticidade extraído do modelo.
Regressão Linear
Com o método de regressão linear simples, você sempre será capaz de traçar
uma reta que minimize o quadrado dos erros. Entretanto alguns dados não se
comportam como uma reta, de forma que o modelo desenvolvido não é
adequado para a descrição dela. Avaliamos a qualidade do modelo a partir da
análise do coeficiente de determinação.
n 2
(∑ (xi − x̄)y )
2 i=1 i
R =
n 2 n 2
∑ (xi − x̄) ∑ (y − ȳ )
i=1 i=1 i
Pode-se provar que seu valor está contido entre 0 e 1. Alguns livros chamam de
coeficiente de determinação o termo R, tal que −1 ≤ R ≤ 1; entretanto
utilizar , tal que , facilita a análise, ao evitar operar com
2 2
R 0 ≤ R ≤ 1
(vide Figura 4.3), mais forte é o poder explicativo do modelo linear. Quanto
mais R
2
→ 0 (vide Figura 4.4), menos podemos confiar no modelo, visto que
os dados não se aproximam de uma reta.
Figura 4.3 — Dados dispersos, mas, aproximadamente, lineares
Fonte: Morettin (2010, p. 472).
praticar
Vamos Praticar
Para os dados do exemplo, representados pela tabela inicial e discutido ao
longo deste estudo, deslocamento versus força, podemos determinar o
coeficiente de determinação deles. A partir do que foi apresentado, use a
n 2
determinação.
Material
Complementar
WEB
ACESSAR
LIVRO
ISBN: 978-85-752-2168-6
Você deve dominar essa técnica básica com cuidado e lembrar-se, principalmente,
de que a utilização dela quase sempre traz um resultado, mas interpretação,
previamente a partir do coeficiente de correlação, é essencial para garantir a
confiabilidade do resultado.
Referências
3 ways to spot a bad statistic | Mona
Chalabi. [S. l.: s. n.], 2017. 1 vídeo (11
min). Publicado pelo canal Ted.
Disponível em:
https://www.youtube.com/watch?
v=Zwwanld4T1w. Acesso em: 19 out.
2021.
Regra da Cadeia - Parte 1 (Aula 9). [S. l.: s. n.], 2016. 1 vídeo (32 min). Publicado
pelo canal Ferreto Matemática. Disponível em: https://www.youtube.com/watch?
v=p9xjPa1EVrw. Acesso em: 19 out. 2021.