Você está na página 1de 24

Princípios de ajustamento de observações

MÉTODO DOS MÍNIMOS QUADRADOS

MODELO MATEMÁTICO, FUNCIONAL E ESTOCÁSTICO

Modelo matemático
Chama-se modelo matemático as sistema teórico ou conceito abstracto através do qual se
descreve uma situação física ou um conjunto de acontecimentos. Esta descrição não é
necessariamente completa ou exaustiva. Como um modelo serve um propósito específico, asua
formação pode variar largamente de um ponto de vista para outro. Deste modo, o mesmo
sistema físico pode ser descrito por mais do que um modelo.
Um modelo matemático pode ser dividido em duas partes conceituais: o modelo
funcional e o modelo estocástico:

Modelo funcional
O modelo funcional é composto por relações que descrevem a geometria ou
características físicas do problema em questão.
Exemplo 1: Para a determinação da área de um terreno rectangular com lados a e b o
modelo funcional é A = ab.
Exemplo 2: Para a determinação da forma de um triângulo com ângulos α, β e γ o
modelo funcional será α + β + γ = 180˚.
.
Modelo estocástico

O modelo estocástico é composto pelo conjunto de relações que descrevem as


propriedades estatísticas dos elementos envolvidos no modelo funcional. O modelo
estocástico indica por exemplo a qualidade das observações feitas (as suas precisões, relativas
ou absolutas), indica se as observações estão correlacionadas ou não, indica ainda as variáveis
que são consideradas constantes durante o ajustamento e as que se pretendem determinar
FINALIDADE DO MÉTODO DOS MÍNIMOS QUADRADOS

De acordo com o que foi dito acima, quando se pretendem determinar uma ou várias
grandezas normalmente fazem-se mais observações do que as estritamente necessárias para
determinar o problema em questão. Devido à superabundância existente temos várias
possibilidades de obter soluções para o problema, que serão tantas quantas as combinações
que podemos formar com as observações, tomadas em número mínimo necessário para
resolver o problema em questão.
Desta forma as observações l1, l2,...,ln não são consistentes com o modelo funcional, e
teremos que substitui-las por um conjunto de estimativas l^ 1, l^ 2,..., l^ n (observações
ajustadas) que satisfaçam o modelo funcional. Estas estimativas são obtidas adicionando a
cada uma das observações uma quantidade denominada de correção ou resíduo (vi) de tal
forma que:
l
^ i = li + vi com i = 1, 2,...,n
Mas existem vários valores de vi que darão origem a um conjunto de observações ajustadas
consistente com o modelo funcional.
EXEMPLO:
Se para determinarmos a forma de um triângulo medirmos os seus três ângulos internos α, β e γ,
teremos como modelo funcional a seguinte equação: α + β + γ = 180˚
É no entanto muito provável que a soma dos três ângulos medidos não seja 180˚, devido à existência
de erros aleatórios nas medições. Suponhamos então que a sua soma excede 180˚ em 3''. Para termos
as observações consistentes com o modelo funcional teremos que substituir os valores observados por
valores ajustados, que podemos obter de várias formas. Neste caso podemos por exemplo subtrair a
cada ângulo observado 1'', ou subtrair 2‘’ a um ângulo e 1'' a outro, ou ainda subtrair os 3'' apenas a
um ângulo, deixando os restantes dois inalterados.
Para escolhermos o "melhor" conjunto de observações ajustadas (ou seja os valores
mais prováveis para as observações ajustadas) vamos utilizar um critério adicional, que é o critério
dos mínimos quadrados.
Imaginemos uma série de dados, conforme indicado na tabela 1, com os dados apresentados
abaixo, como podemos determinar uma reta com estes valores.

Tabela 1. (Ajustar para 4 pontos)

x 1 4 3 5

y 3 4 2,5 0,5

fonte: Autor.
Segue o ajustamento de uma reta ou equação de 1o grau pelo MMQ
Existem vários fenômenos onde uma função, ou curva, apresenta distribuição linear:
S = ∑ [yi − fi]²
S = ∑ [yi − (ax + b)]²
S = [y₁ −(ax₁ + b)]² + [y₂ −(ax₂ + b)]² + [y₃ −(ax₃ + b)]² + [y₄ −(ax₄ + b)]² S = [3 −(1a + b)]² + [4 −(2a + b)]² + [2,5 −(3a + b)]² + [0,5 −
(5a + b)]²
Derivando
∂ S/∂ a = 2[3 − a − b]¹( − 1) + 2[4 − 2a − b]¹( − 2) + 2[2,5 − 3a − b]¹( − 3) + 2[0,5 − 5a − b]¹( − 5) = 0
∂ S/∂ b = 2[3 − a − b]¹( − 1) + 2[4 − 2a − b]¹( − 1) + 2[2,5 − 3a − b]¹( − 1) + 2[0,5 − 5a − b]¹( − 5) = 0
S1 – Resolvendo do sistema:
21 – 39a – 11b = 0
10 – 11a – 4b = 0
Resulta:
f(x) = -0,742x + 4,542
Dados referentes ao Lucro Operacional Líquido de uma companhia

Tabela 2. (Ajustar para 6 pontos)

Ano Ano Lucro Operacional Líquido em (em


1.000 reais)
2009 1 112
2010 2 149
2011 3 238
2012 4 354
2013 5 580
2014 6 867
Fonte: Autor.
Ajustar os dados através de um modelo linear.

SCRIPT – Lucro Líquido x Ano (colar na linha de comando do Sistema R e dar Ctrl R)
> ano <- c(1,2,3,4,5,6) # (Coluna ou vetor)
> ano
> lucro_liq <- c(112,149,238,354,580,867) # (Coluna ou vetor)
> lucro_liq
> plot (lucro_liq ~ ano)
> modLn <- lm (lucro_liq ~ ano)
> modLn
> abline (modLn)
Figura 1. Os dados seguem uma curva exponencial.

Fonte: Autor.
Figura 2. Os dados não se ajustam a uma curva linear.

onte: Autor.
Lucro Líquido x Ano (colar a outra parte na linha de comando do Sistema R e dar Ctrl R)
> lucro_liq_l <- log(lucro_liq)

> luro_liq_l

> plot (lucro_liq_l ~ ano)

> modLn <- lm (lucro_liq_l ~ ano)

> modLn

> abline (modLn)


Figura 3. Após a transformação usando logaritmo, os dados seguem uma curva linear.

Fonte: Autor
Título do vídeo

Figura 4. Os dados se ajustam a uma curva linear.

Fonte: Autor
Dados referentes à Consumo x Renda

Tabela 3. (Ajustar para 6 pontos).

Ano Consumo (em 1.000 reais) Renda (em 1.000 reais)


2009 122 139
2010 114 126
2011 86 90
2012 134 144
2013 146 163
2014 107 136
Fonte: Autor.
Ajustar os dados através de um modelo linear – Produção de leite x Índice
pluviométrico

> y_prod_leite <- c (26,25,31,29,27,31,32,28,30,30)


> y_prod_leite
> ny <- length(y_prod_leite)
> ny
> x_indice_pluv <- c (23,21,28,27,23,28,27,22,26,25)
> x_indice_pluv
> nx <- length(x_indice_pluv)
> nx
> sy <- sum (y_prod_leite)
> sy
> sx <- sum (x_indice_pluv)
> sx
> sxy <- sum (x_indice_pluv * y_prod_leite)
> sxy
> sxx <- sum (X_INDICE_PLUV^2)
> sxx
> sqxy <- (sxy - (sx*sy)/nx)
> sqxy
> sqx <- (sxx – SXX^2/NX)
> sqx
> b <- sqxy/sqx
> b
> a <- (sy/ny) - b * (sx/nx)
> a
> plot (y_prod_leite ~ x_indice_pluv)
> modLn <- lm ( y_prod_leite ~ x_indice_pluv)
> modLn
> abline (modLn)
Tabela 4. Elementos.

Área Condutividade Nitrogênio Perímetro Turbidez


ua1 0.16 28.55 315.4 4.83 16.47
ua2 0.09 41.45 455.7 2.17 26.65
ua3 0.24 38.7 525.2 6.32 20.75
ua4 0.28 56 221.2 4.79 26.9
ua5 0.88 5.67 280.0 23.42 19345
ua6 0.13 48.55 546.5 2.93 15.23
ua7 0.39 42.5 399.8 5.52 16265
ua8 1.42 35.1 398.1 18.23 22.35
ua9 1.87 29.15 333.7 20.09 13035
ua10 0.37 32.75 430.5 7.96 21

Fonte - Autor

Calcule a equação da regressão linear e o coeficiente de determinação (R2) entre todas as


variáveis em relação à área. Utilize, organizadamente, apenas um Script do R que contenha
todos os procedimentos.
Regressão linear

A regressão linear é chamada linear porque se considera que a relação da resposta às variáveis é uma
função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos
parâmetros se chamam modelos de regressão não linear. Sendo uma das primeiras formas de análise
regressiva a ser estudada rigorosamente, e usada extensamente em aplicações práticas. Isso acontece
porque modelos que dependem de forma linear dos seus parâmetros desconhecidos são mais fáceis de
ajustar que os modelos não lineares aos seus parâmetros, e porque as propriedades estatísticas dos
estimadores resultantes são fáceis de determinar. (REIS, 1994).

> x<- C(1:20)


> x
> y<- x
> y
> plot(x,y)
Figura 3

Fonte: Autor.
A regressão não linear é uma forma de análise observacional em que os dados são modelados por uma função
que é uma combinação não linear de parâmetros do modelo e depende de uma ou mais variáveis
independentes. Os dados são ajustados geralmente pelo Método dos Mínimos Quadrados ou por algum
método de aproximações sucessivas. Um modelo de regressão é não linear quando pelo menos um dos seus
parâmetros aparece de forma não linear. (Wikipédia, Mazucheli, 2010)

> x<- c(1:20) Figura 4


>x
> y<- x^2
>y
> plot (x,y)

Fonte: Autor
O problema de ajustar uma função arbitrária a um conjunto de pontos experimentais não tem solução definitiva. Uma
infinidade de funções poderiam ser ajustadas aos pontos da figura 10, todas satisfatórias do ponto de vista estatístico.
No que segue é considerado o problema mais restrito de ajustar uma particular função entre tipos de funções com
formas predeterminadas. Como exemplo deste procedimento, pode-se considerar o problema de ajustar um polinômio
de grau qualquer aos pontos da figura 10. A solução do problema consiste em determinar o polinômio mais adequado
para descrever os pontos experimentais. (Vuolo, 1992).
As funções de formas predeterminadas a serem ajustadas podem ser caracterizadas por p parâmetros a1, a2, …, ai, …. ap.
Neste caso, o problema de ajustar uma função se reduz a determinar os valores dos parâmetros que são mais adequados.
Por exemplo, um polinômio é dado por:
f(x) = a1 + a2x + a3x2 + … + aj+ixj + … + apxp-1
Nesse caso, devem ser determinados o grau (p – 1) do polinômio, bem como os valores dos coeficientes ou parâmetros a
a1 + a2 + a3 + … + aj+i + … + ap

OBS: Uma função f(x) pode ser "expandida" também em uma série de Fourier onde a função é aproximada pela soma de
senos e cossenos do seguinte modo:
f(x) = a0+ a1 sen(x) +a2 sen(2x) +a3 sen(3x)+ ... + b1 cos(x) + b2 cos(2x) + ...
Fourier conseguiu achar uma forma simples e elegante de calcular esses coeficientes a0, a1, a2, ... , b1, b2.
Obrigado!

Você também pode gostar