Você está na página 1de 106

MT Ciência – Série Livros

Rubens Pazim
Odair José Teixeira da Fonseca

MODELOS MATEMÁTICOS:
análise de regressão com o GeoGebra
1ª Edição

Cuiabá, MT
Fundação UNISELVA

ii
MT Ciência – Série Livros

© 2022 by Fundação UNISELVA / MT Ciência

Direitos de Edição reservados à Fundação UNISELVA.

Todos os direitos reservados. Nenhuma parte desta publicação pode ser


reproduzida, apropriada e estocada, por qualquer forma ou meio, sem
autorização do detentor dos seus direitos de edição.

Ficha catalográfica elaborada pela Seção de Catalogação e


Classificação da Biblioteca Regional da UFMT-Sinop
P348m Pazim, Rubens; Fonseca, Odair José Teixeira.
Modelos matemáticos: análise de regressão com o GeoGebra /
Evaldo Martins Pires. - Cuiabá: Fundação Uniselva, 2022. (MT
Ciência – Série Livros)

Livro eletrônico. Ilustrado e colorido

ISBN: 978-65-86743-82-1

1. Análise de dados. 2. Aplicabilidade. 3. Modelos de regressão. I.


Rubens Pazim. II. Odair José Teixeira Fonseca. III. Título.

CDU 519.2

Bibliotecária: Carolina Alves Rabelo


CRB1/2238

Artes da capa e contracapa: Rubens Pazim


Diagramação do livro: Rubens Pazim
Editoração: Evaldo Martins Pires
Sinop, Mato Grosso, Brasil

iii
MT Ciência – Série Livros

CONSELHO EDITORIAL

Editor
Dr. Evaldo Martins Pires (UFMT)

Editores de Área:

Ciências Agrárias
Dr. Marco Antonio de Oliveira (UFV)
Dr. Marcus Alvarenga Soares (UFVJM)

Ciência Animal
Dr. Dalton Henrique Pereira (UFMT)
Dr. Artur Kanadani Campos (UFV)

Ciências Biológicas
Dr. Leandro Denis Battirola (UFMT)
Dr. José Roberto Tavares (UFMT)
Dr. Domingos de Jesus Rodrigues (UFMT)

Ciências Exatas
Dr. Fábio Nascimento Fagundes (UFMT)

Ciências da Saúde
Dr. Pacífica Pinheiro Cavalcante (UFMT)
Dra. Gisele Facholi Bonfim (UFMT)
Me. Camila da Silva Turini (UFMT)

Engenharias
Dra. Roberta Martins Nogueira (UFMT)
Dr. Juliana Lobo Paes (UFRRJ)

Química
Dra. Dênia Mendes de Souza Valladão (UFMT)
Dr. Brenno Santos Leite (UFV)

Educação Infantil
Esp. Anelise Oliveira Tores Valle (SMEC/Sinop)
Me. Micheli Cátia Favaretto (UNIC/Sinop)

Língua Portuguesa
Me. Rosana de Barros Varela (UNEMAT/Sinop)
Luciane Raquel Wobeto Cordeiro (UFMT – Sinop)

Fichas Técnicas
Dra. Paula Sueli Andrade Moreira (UFMT)
Dr. Carlos Vinício Vieira (UFMT)
Dr. Rodrigo Sinaid Zandonadi (UFMT)
Me. Roberto Carlos Beber (UFMT)

iv
MT Ciência – Série Livros

AUTORES

Rubens Pazim Carnevarollo Júnior. Bacharel em Matemática Pura e


Licenciado em Matemática, Mestre em Matemática Pura e Doutor em
Matemática pela Universidade Estadual Paulista Câmpus de São José do Rio
Preto UNESP – Rio Preto. Trabalha como professor Adjunto IV na
Universidade Federal do Mato Grosso Câmpus de Sinop UFMT – Sinop.
Atua como pesquisador na área de Sistemas Dinâmicos com ênfase em
Modelos Matemáticos.
Email: pazim@ufmt.br
Lattes: http://lattes.cnpq.br/5805356255692395
Orcid: https://orcid.org/0000-0001-6242-208X

Odair José Teixeira da Fonseca. Licenciado em Ciências Naturais e


Matemática – habilitação: Matemática, pela Universidade Federal de Mato
Grosso Câmpus de Sinop UFMT – Sinop. Mestre em Matemática Aplicada e
Computacional pela Universidade Estadual de Campinas, UNICAMP.
Trabalha como professor Assistente B1 na Universidade Federal de Rondônia
Câmpus de Ariquemes UNIR – Ariquemes. Atua com pesquisa em
Biomatemática.
Email: odairfonseca@unir.br
Lattes: http://lattes.cnpq.br/9302331422087866
Orcid: https://orcid.org/0000-0003-1469-1378

v
MT Ciência – Série Livros

“Make everything as simple as possible, but


not simpler.”
(Albert Einstein)

vi
MT Ciência – Série Livros

vii
MT Ciência – Série Livros

SUMÁRIO
INTRODUÇÃO............................................................................................. 2
ANÁLISE DE REGRESSÃO ............................................................................ 6
Regressão Linear .................................................................................... 8
Regressão Não Linear (Caso Linearizável) ............................................. 18
Regressão Não Linear (Caso Não Linearizável) ...................................... 23
Coeficiente de Determinação 𝑹𝟐 ......................................................... 33
ANÁLISE DE REGRESSÃO NO GEOGEBRA ................................................. 40
Planilhas no GeoGebra ......................................................................... 42
Regressão Linear no GeoGebra ............................................................ 45
Coeficiente de Determinação 𝑹𝟐 no GeoGebra ................................... 48
Regressão Não Linear no GeoGebra ..................................................... 50
MODELAGEM: DADOS EXPERIMENTAIS................................................... 58
Lei de Hooke ........................................................................................ 59
Produção de Soja ................................................................................. 63
Temperatura do Solo............................................................................ 74
Arremesso de Peso............................................................................... 76
Criminalidade ....................................................................................... 78
COVID-19 ............................................................................................. 83
MATERIAL CONSULTADO ......................................................................... 90
Obras do Programa MT CIÊNCIA .............................................................. 94
Série Livros ........................................................................................... 94
Série Acadêmica ................................................................................... 94
Série Tecnologia ................................................................................... 95
Série Pequenos Cientistas .................................................................... 95
Série Eu e o Outro ................................................................................ 96
Série O Segredo dos Alimentos............................................................. 96
Série Melhor Idade ............................................................................... 96
Série Ciência Divertida ......................................................................... 96

viii
MT Ciência – Série Livros

1
MT Ciência – Série Livros

INTRODUÇÃO

A modelagem matemática desempenha um papel


fundamental no auxílio da compreensão de fenômenos naturais,
sociais e econômicos. Segundo Bassanezi (2019, p. 24),
“modelagem matemática é um processo dinâmico utilizado para
a obtenção e validação de modelos matemáticos”. Em geral,
existem vários tipos de modelos matemáticos e a técnica de
modelagem vai depender das características do problema a ser
modelado. Essencialmente, “os modelos matemáticos podem ser
formulados de acordo com a natureza dos fenômenos ou
situações analisadas e classificados conforme o tipo de
matemática utilizada” (BASSANEZI, 2019, p. 20).
A utilização de Tecnologias da Informação e
Comunicação (TICs) no contexto da educação, em especial na
modelagem matemática tem se tornado imprescindível, pois,
segundo Meyer, Caldeira e Malheiros (2019), é capaz de
otimizar a experimentação e investigação e com isso viabiliza
simulações e previsões. Também é destacado pelos autores que
o aspecto visual dos recursos computacionais pode facilitar a
compreensão do fenômeno estudado:
2
MT Ciência – Série Livros

[...] a visualização, aspecto importante para


compreensão de determinados conceitos
matemáticos e que pode ser facilitada pela
presença das TICs, pode também colaborar com
o desenvolvimento da modelagem (MEYER;
CALDEIRA; MALHEIROS, 2019, p. 110).

Nesse sentido, o uso do GeoGebra se constitui como


uma das muitas alternativas e possibilidades que podem ser
utilizadas no ambiente acadêmico para o aprendizado de
matemática, sendo que, a grande vantagem para a escolha desse
software é o acesso livre, permitindo assim maior alcance,
consequentemente, acesso, no meio científico e no espaço
escolar.
No contexto didático, o diferencial do GeoGebra é
possuir uma interface totalmente dinâmica por meio de “botões”
que permitem a omissão/exibição gráfica dos objetos
explorados, assim, facilita a apresentação dos dados tornando-a
dinâmica. Por se tratar de um programa com difusão mundial,
não apenas na língua portuguesa, uma particularidade do
GeoGebra é o uso de ponto como separador decimal. Assim,
para padronizar a escrita do texto com a linguagem do software,
utilizaremos a separação decimal com o ponto ao invés de
vírgula.
Ao escrever este livro, nosso principal objetivo é
apresentar ao leitor alguns aspectos da modelagem matemática
3
MT Ciência – Série Livros

por meio do ajuste de curvas (ou análise de regressão) com a


utilização de recursos computacionais, mais precisamente,
utilizamos o software livre GeoGebra, cuja interface possibilita
o trabalho com várias áreas da matemática, tanto do ponto de
vista geométrico quanto algébrico. Com isso, buscamos gerar
uma aproximação entre a matemática ensinada no ensino básico
com a matemática do ensino superior e a pesquisa científica.
A abordagem utilizada não tem como finalidade
explorar a teoria da análise de regressão, ou propor novos
modelos matemáticos. Assim, nos limitaremos a apresentar
alguns tipos de modelos que são utilizados em regressões
lineares e não lineares, bem como o coeficiente de determinação
𝑅2 a partir de várias situações problemas (hipotéticas e realistas)
com o foco principal na utilização do GeoGebra. Também não
temos o propósito de aprofundar no tema referente à modelagem
matemática, apenas descreveremos, suscintamente, qual é sua
importância, tanto no ensino quanto na pesquisa. Ao leitor
interessado no assunto indicamos (BASSANEZI, 2019;
BASSANEZI, 2015; MEYER; CALDEIRA; MALHEIROS,
2019).
Diante disso, este livro está organizado da seguinte
forma: no capítulo Análise de Regressão discutimos, ainda que
de forma sucinta, a teoria e exibimos alguns exemplos de
4
MT Ciência – Série Livros

regressões linear e não linear. Finalizamos este capítulo com o


conceito matemático do coeficiente de determinação 𝑅 2 . No
capítulo Análise de Regressão no GeoGebra, apresentamos um
passo a passo de como utilizar os recursos do GeoGebra no
contexto do ajuste de curvas. Por fim, no último capítulo
Modelagem: Dados Experimentais, nos dedicamos a uma
abordagem com o GeoGebra para o ajuste de curvas aplicados a
diversos casos reais, obtidos de artigos publicados em
periódicos, livros e experimentos realizados em laboratórios.
Este capítulo busca desenvolver uma aproximação entre a
produção científica dos respectivos casos com o ensino de
funções (modelos usados nas regressões).

5
MT Ciência – Série Livros

Capítulo 1
ANÁLISE DE REGRESSÃO

Muitas vezes, ao se fazer uma pesquisa, pode ou não


ser realizada uma coleta de dados numéricos. Se forem
numéricos, é comum serem sintetizados de modo que seja
possível exibi-los de forma prática, de acordo com suas
propriedades. Quando o conjunto de valores está relacionado a
duas variáveis, é conveniente plotá-los em um sistema
cartesiano onde cada um dos eixos representará uma das
grandezas pesquisadas, o gráfico obtido é denominado diagrama
de dispersão.
Na Figura 1 temos três exemplos de diagramas de
dispersão: no item (a) observe que os pontos se comportam na
forma de uma elipse achatada, ao passo que no caso (b) os pontos
apresentam um comportamento similar ao de uma hipérbole; no
cenário (c) temos uma configuração do tipo parabólico.

6
MT Ciência – Série Livros

Figura 1. Exemplos de diagramas de dispersão. (Fonte: Elaborado pelos


autores).

Para cada situação na Figura 1, deve-se escolher o tipo


de regressão que melhor se ajusta ao conjunto de dados. No item
(a), uma reta parece ser uma boa escolha para ajustar o conjunto
de pontos, neste caso, temos uma regressão linear. Em (b), é
razoável pensar em uma curva hiperbólica, ao passo que no
cenário (c), uma função quadrática se constitui como a melhor
alternativa viável de ajuste à malha de pontos. Nas
configurações (b) e (c) dizemos que a regressão é não linear.
Evidentemente, existem vários outros tipos de funções que
podem ser usadas em regressão não linear, por exemplo:
exponenciais, logarítmicas e trigonométricas.
Nas seções seguintes deste capítulo nos dedicaremos ao
estudo mais detalhado de regressão linear, alguns casos
particulares de regressão não linear e do coeficiente de
determinação 𝑅 2 , um parâmetro que pode ser interpretado como

7
MT Ciência – Série Livros

a medida da proximidade do ajuste aos dados (WAKEFIELD,


2013). Ao leitor interessado em uma leitura mais aprofundada
sobre o assunto recomendamos (GROB, 2003; WAKEFIELD,
2013; DEKKING; et al. 2005; BUSSAB; MORETTIN, 2011;
CRESPO 2009). Por outro lado, o leitor pouco familiarizado
com os conceitos matemáticos abordados poderá omitir o estudo
teórico de uma ou mais seções deste capítulo, ao passo que a
compreensão do restante do texto não estará comprometida.

Regressão Linear
Apresentaremos uma breve introdução à teoria da
regressão linear e alguns exemplos didáticos. Estes exemplos
estão elaborados de forma que se possa chegar ao problema
central, mais precisamente, iremos descrever o modelo de
regressão linear bem como sua representação em notação
matricial (GROB, J. 2013).

Problema do IDEB

Considere, conforme Tabela 1, o Índice de


Desenvolvimento da Educação Básica (IDEB) para o 9º ano das
escolas estaduais do estado de Mato Grosso.

8
MT Ciência – Série Livros

Tabela 1. IDEB das escolas estaduais do 9º ano – MT


ANO IDEB Observado
2005 2.9
2007 3.6
2009 4.2
2011 4.3
2013 4.2
2015 4.5
2017 4.6
2019 4.5
(Fonte: MEC – INEP).

Na Figura 2 apresentamos o diagrama de dispersão do


conjunto de valores da Tabela 1, como podemos observar, a
distribuição de pontos parece muito que está sob uma reta, sendo
assim, neste caso será escolhida uma regressão linear para
modelarmos o problema.

Figura 2. Diagrama de dispersão para os valores da Tabela 1. (Fonte:


Elaborado pelos autores).

9
MT Ciência – Série Livros

Agora, suponhamos que se deseja obter uma estimativa


do IDEB para o ano de 2014. Para isso, construímos o diagrama
de dispersão dos valores da Tabela 1 conforme ilustrado na
Figura 2. A partir da análise do diagrama de dispersão, é
razoável pensarmos em um ajuste de curva do tipo linear, isto é,
ajustarmos o conjunto de pontos por uma reta do tipo

𝑦 = 𝑎𝑥 + 𝑏 (1)

em que 𝑦 é a variável dependente que representa o IDEB e 𝑥 é a


variável independente tempo (em anos).
Uma das formas de determinar os coeficientes 𝑎 e 𝑏 da
equação (1), é substituindo os valores da Tabela 1 na equação
(1) (sendo 𝑥 a variável independente ano e 𝑦 a variável
dependente IDEB observado) obtendo o sistema de equações
lineares (2).
2005𝑎 + 𝑏 = 2.9
2007𝑎 + 𝑏 = 3.6
2009𝑎 + 𝑏 = 4.2
2011𝑎 + 𝑏 = 4.3 (2)
2013𝑎 + 𝑏 = 4.2
2015𝑎 + 𝑏 = 4.5
2017𝑎 + 𝑏 = 4.6
{ 2019𝑎 + 𝑏 = 4.5

Observe que o sistema de equações lineares (2) tem 8


equações e duas incógnitas (𝑎 e 𝑏), o que torna o uso dos
métodos “tradicionais” de resolução de sistemas de equações
10
MT Ciência – Série Livros

lineares inviável. O sistema (2) pode ser escrito na forma


matricial 𝐴𝑿 = 𝑩 da seguinte forma
2005 1 2.9
2007 1 3.6
2009 1 4.2
2011 1 𝑎 4.3
[ ]= (3)
2013 1 ⏟ 𝑏 4.2
2015 1 𝑿 4.5
2017 1 4.6
[⏟2019 1] [
⏟4.5 ]
𝐴 𝑩

multiplicando ambos os lados da igualdade (3) à esquerda por


𝐴𝑇 , obtemos o sistema equivalente
(𝐴𝑇 𝐴)𝐱 = 𝐴𝑇 𝑩
dado por
32385320 16096 𝑎 66010.6
[ ] [⏟] = [ ] (4)
⏟ 16096 8 𝑏 ⏟ 32.8
𝐴𝑇 𝐴 𝑿 𝐴𝑇 𝑩

Agora, multiplicando ambos os lados da equação (4) à


esquerda por (𝐴𝑇 𝐴)−1, obtemos
𝑎 0.10119
[ ]= [ ]
𝑏 −199.49524
de onde segue que
𝑎 = 0.10119 e 𝑏 = −199.49524
Assim, a reta que ajusta o conjunto de valores do diagrama de
dispersão exibido na Figura 2 é dada por

11
MT Ciência – Série Livros

𝑦 = 0.10119𝑥 − 199.49524 (5)

A equação (5) é denominada reta de regressão do


conjunto de valores apresentados na Tabela 1. Na Figura 3
esboçamos o diagrama de dispersão e a reta de regressão
determinada pela equação (5).

Figura 3. Diagrama de dispersão e reta de regressão – problema do IDEB.


(Fonte: Elaborado pelos autores).

Finalmente, o IDEB do ano de 2014 pode ser estimado


substituindo 𝑥 = 2014 na equação (5), isto é,
𝑦 = 0.10119 ⋅ 2014 − 199.49524 = 4.30142
Observe na Figura 3 que dos oito pontos apenas três
estão sobre a reta de regressão
𝑦 = 0.10119𝑥 − 199.49524

12
MT Ciência – Série Livros

Ou seja, a reta encontrada para aproximação apresenta um


desvio para cada ponto do conjunto de dados. Por exemplo, se
denotarmos esse erro por
𝜖𝑖 = |𝑓(𝑥𝑖 ) − 𝑦𝑖 |, 𝑖 = 1, 2, ⋯ , 𝑛
temos que o erro de aproximação para o IDEB do ano de 2015 é
𝜖6 = |𝑓 (2015) − 𝑦6 | = |4.40261 − 4.5| = 0.09739
Assim, é razoável pensarmos em uma forma de
determinar uma reta de regressão que minimize esse erro, ou
seja, uma reta que melhor ajuste os pontos da malha. Uma
maneira de fazermos isso é através do método de mínimos
quadrados.
Essencialmente, um problema de mínimos quadrados
consiste em dado um sistema linear 𝐴𝐱 = 𝐛 com m equações e
n incógnitas, encontrar um vetor x que minimize ‖𝐛 − 𝐴𝐱‖ em
relação ao produto interno de ℝ𝑚 . Neste caso, dizemos que x é
uma solução de mínimos quadrados do sistema, 𝐛 − 𝐴𝐱 é o vetor
erro de mínimos quadrados e ‖𝐛 − 𝐴𝐱‖ é o erro de mínimos
quadrados (ANTON; RORRES, 2012).
Os dois teoremas a seguir fornecem uma fórmula
explícita para solução de mínimos quadrados (ANTON;
RORRES, 2012).
Teorema 1 Se 𝐴 for uma matriz 𝑚 × 𝑛, as afirmações seguintes
são equivalentes.
13
MT Ciência – Série Livros

i) Os vetores colunas de 𝐴 são linearmente independentes.


ii) 𝐴𝑇 𝐴 é invertível.
Teorema 2 Se 𝐴 for uma matriz 𝑚 × 𝑛 com vetores colunas
linearmente independentes, então dada qualquer matriz 𝐛 de
tamanho 𝑚 × 1, o sistema linear 𝐴𝐱 = 𝐛 tem uma única solução
de mínimos quadrados. Essa solução é dada por

𝐱 = (𝐴𝑇 𝐴)−1 𝐴𝑇 𝐛 (6)

Note que a igualdade da equação (6) é factível sob as


hipóteses do Teorema 1. Com isso justificamos o procedimento
utilizado para resolver o problema do IDEB. Portanto, a reta de
regressão (5) tem o erro minimizado, ou seja, é a reta que melhor
ajusta os dados da Tabela 1.
A abordagem de mínimos quadrados apresentada acima
está relacionada com conceitos de Álgebra Linear, mais
precisamente a algumas operações com matrizes, o que
evidencia uma das várias aplicabilidades da teoria estudada
nessa área.
No entanto, o problema de mínimos quadrados também
pode ser abordado com o viés da teoria estatística.
Essencialmente, dado um conjunto de valores (𝑥1 , 𝑦1),
(𝑥2 , 𝑦2 ), ⋯ , (𝑥𝑛 , 𝑦𝑛 ), um ajuste desses valores será linear se tiver
a forma

14
MT Ciência – Série Livros

𝑦 = 𝑎𝑥 + 𝑏 (7)

Em que os coeficientes 𝑎 e 𝑏 são determinados de forma que a


soma dos quadrados dos desvios seja mínima.
𝑛
(8)
𝑆(𝑎, 𝑏) = ∑(𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖 )2
𝑖=1
Do cálculo diferencial sabemos que os pontos de
mínimo de (8) ocorrem quando suas derivadas parciais em
relação a 𝑎 e 𝑏 são nulas, isto é,
𝜕𝑆 𝜕𝑆
= =0
𝜕𝑎 𝜕𝑏
Assim, devemos ter
𝑛
𝜕𝑆
= ∑ 2𝑥𝑖 (𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖 ) = 0
𝜕𝑎
𝑖=1
𝑛
𝜕𝑆
= ∑ 2(𝑎𝑥𝑖 + 𝑏 − 𝑦𝑖 ) = 0
{ 𝜕𝑏
𝑖=1
De onde obtemos
𝑛 𝑛 𝑛

∑ 𝑎𝑥𝑖2 + ∑ 𝑏𝑥𝑖 − ∑ 𝑥𝑖 𝑦𝑖 = 0
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛

∑ 𝑎𝑥𝑖 + ∑ 𝑏 − ∑ 𝑦𝑖 = 0
{ 𝑖=1 𝑖=1 𝑖=1

Observe que ∑𝑛𝑖=1 𝑏 = 𝑛𝑏, com isso podemos reescrever as


equações acima como

15
MT Ciência – Série Livros

𝑛 𝑛 𝑛
𝑎 ∑ 𝑥2𝑖 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑥𝑖 𝑦 𝑖
𝑖=1 𝑖=1 𝑖=1 (9)
𝑛 𝑛
𝑛𝑏 + 𝑎 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
{ 𝑖=1 𝑖=1

Isolando 𝑏 na segunda igualdade em (9) obtemos


∑ 𝑦𝑖 − 𝑎 ∑ 𝑥𝑖
𝑏=
𝑛
Substituindo 𝑏 na primeira igualdade em (9), obtemos

𝑛∑𝑥𝑖 𝑦𝑖 − ∑𝑥𝑖 ∑𝑦𝑖


𝑎= (10)
𝑛∑𝑥𝑖2 − (∑𝑥𝑖 )2
e

𝑏 = 𝑦 − 𝑎𝑥 (11)

em que 𝑥 é a média dos valores 𝑥𝑖 e 𝑦 é a média dos valores 𝑦𝑖 .


Agora, como os parâmetros 𝑎 e 𝑏 dispostos nas
fórmulas (10) e (11) estão expressos em função dos dados
tabelados 𝑥𝑖 e 𝑦𝑖 , segue que eles podem ser calculados
diretamente na tabela. Vejamos a configuração da resolução do
problema do IDEB na Tabela 2.

16
MT Ciência – Série Livros

Tabela 2. Dados do problema do IDEB ajustados para utilização nas


fórmulas (10) e (11)
ANO (𝒙𝒊 ) IDEB (𝒚𝒊 ) 𝒙𝟐𝒊 𝒙 𝒊 𝒚𝒊
2005 2.9 4 020 025 5 814.5
2007 3.6 4 028 049 7 225.2
2009 4.2 4 036 081 8 437.8
2011 4.3 4 044 121 8 647.3
2013 4.2 4 052 169 8 454.6
2015 4.5 4 060 225 9 067.5
2017 4.6 4 068 289 9 278.2
2019 4.5 4 076 361 9 085.5
∑ 16096 32.8 32 385 320 6 6010.6
(Fonte: Elaborado pelos autores).

Note que, neste caso temos:


• 𝑛=8
16096
• 𝑥= = 2012
8
32.8
• 𝑦= = 4.1
8

• ∑𝑥𝑖 = 16 096
• ∑ 𝑥𝑖2 = 32 385 320
• ∑𝑥𝑖 𝑦𝑖 = 66 010.6
Substituindo os respectivos valores nas equações (10) e
(11) obtemos
8 ⋅ 66 010.6 − 16 096 ⋅ 32.8 136
𝑎= 2
= = 0.10119
8 ⋅ 32 385 320 − (16 096) 1 344

17
MT Ciência – Série Livros

𝑏 = 4.1 − 0.10119 ⋅ 2012 = −199.49524


Logo, a reta de regressão é dada por
𝑦 = 0.10119𝑥 − 199.49524
Observe que o resultado obtido é exatamente igual ao
encontrado com as operações matriciais.

Regressão Não Linear (Caso Linearizável)


Em alguns casos, por meio de uma mudança de
variáveis, é possível transformar um modelo não linear em um
modelo linear equivalente. No entanto, de forma geral nem
sempre podemos usar esse mecanismo e os parâmetros são
determinados numericamente. Este caso será discutido na
próxima seção deste capítulo. Aqui, nos limitaremos a
apresentar um modelo não linear cujos parâmetros possam ser
determinados por meio de um modelo linear. Ao leitor
interessado em uma leitura mais avançada sobre regressão não
linear recomendamos (CHAPRA; CANALE, 2011; HUET; et
al. 2004; IVANOV, 1997).

Problema da Poupança
Suponha que um investidor realize uma aplicação
inicial de R$ 5 000,00 com aportes anuais variados e taxas de

18
MT Ciência – Série Livros

juros flutuantes. Na Tabela 3 a seguir encontra-se registrada a


evolução patrimonial desse investidor ao longo de 15 anos.

Tabela 3. Dados hipotéticos sobre evolução patrimonial


Tempo (em anos) Capital acumulado
0 5 000
1 5 800
2 6 696
3 7 699.52
4 8 823.462
5 10 082.28
6 11 492.15
7 13 071.21
8 14 839.75
9 16 820.53
10 19 038.99
11 21 523.67
12 24 306.51
13 27 423.29
14 30 914.08
15 34 823.77
(Fonte: Elaborado pelos autores).

Na Figura 4 plotamos o diagrama de dispersão para os


valores da Tabela 3. Note que uma reta não ajustará bem o
conjunto de pontos. Mais precisamente, uma análise gráfica do
diagrama de dispersão sugere um ajuste exponencial do tipo
𝑦 = 𝑎𝑒 𝛽𝑥 (12)

19
MT Ciência – Série Livros

Figura 4. Diagrama de dispersão para os valores da Tabela 3. (Fonte:


Elaborado pelos autores).

A ideia é, por meio de uma mudança de variáveis,


transformar a igualdade (12) em uma equação na qual o segundo
membro seja uma função linear (aqui nos referimos à linearidade
com relação aos parâmetros) para então podermos determinar os
valores dos parâmetros 𝑎 e 𝛽. Podemos fazer isso aplicando o
logaritmo natural em ambos os lados da igualdade (12), obtendo
ln(𝑦) = ln(𝑎) + ln(𝑒 β𝑥 )
de onde segue que

𝑤 = 𝛽𝑥 + 𝛼 (13)

em que, 𝑤 = ln(𝑦), e 𝛼 = ln(𝑎). Portanto,


𝑎 = 𝑒𝛼

20
MT Ciência – Série Livros

Agora, vamos reescrever a Tabela 3 ajustando-a aos


parâmetros da equação (13).

Tabela 4. Dados do problema da poupança ajustados para utilização nas


fórmulas (10) e (11)
Ano (𝒙_𝒊) 𝒘𝒊 = 𝒍𝒏 (𝒚𝒊 ) 𝒙𝟐𝒊 𝒙𝒊 𝒘𝒊
0 8.517193 0 0
1 8.665613 1 8.665613
2 8.809266 4 17.61853
3 8.948913 9 26.84674
4 9.085170 16 36.34068
5 9.218534 25 46.09267
6 9.34942 36 56.09652
7 9.478167 49 66.34717
8 9.605065 64 76.84052
9 9.730355 81 87.5732
10 9.854244 100 98.54244
11 9.976908 121 109.746
12 10.09850 144 121.182
13 10.21915 169 132.8489
14 10.33897 196 144.7455
15 10.45806 225 156.8708
∑ 120 152.3535 1240 1 186.357
(Fonte: Elaborado pelos autores).

Concatenando os dados da Tabela 4, obtemos


• 𝑛 = 16, 𝑥 = 7.5, 𝑤 = 9.522,
• ∑𝑥𝑖 = 120, ∑𝑥𝑖2 = 1240, ∑𝑥𝑖 𝑤𝑖 = 1186.357
Assim, substituindo os respectivos valores nas
fórmulas (10) e (11), temos
21
MT Ciência – Série Livros

16 ⋅ 1186.36 − 120 ⋅ 152.35 699.29


𝛽= = = 0.129
16 ⋅ 1240 − (120)2 5440
e
𝛼 = 9.522 − (0.129 ⋅ 7.5) = 8.555
Assim,
𝑎 = 𝑒 8.555 = 5192.653
Portanto, a curva que ajusta os dados da Tabela 3 é dada por
𝑦 = 5192.653𝑒 0.129𝑥 (14)

Na Figura 5 apresentamos o diagrama de dispersão do


conjunto de pontos e a respectiva curva de regressão. Observe
que o ajuste do tipo exponencial, conforme a igualdade (12) se
adequa muito bem ao conjunto de valores da Tabela 3.
A justificativa teórica pela escolha desse tipo de função
(além da análise do comportamento dos valores dispostos no
diagrama de dispersão), se dá pelo motivo de que o regime de
capitalização por juros compostos é matematicamente descrito
por uma função exponencial com relação ao tempo. Ao leitor
interessado em maiores detalhes sobre matemática financeira
indicamos Dal Zot e Castro (2015), Castanheira e Macedo
(2010) e Iezzi, Hazzan e Degenszajn (2013).

22
MT Ciência – Série Livros

Figura 5. Diagrama de dispersão e curva de regressão para os valores da


Tabela 3. (Fonte: Elaborado pelos autores).

Regressão Não Linear (Caso Não Linearizável)


Nesta seção buscamos discutir aspectos sobre a
convergência de regressão não linear, cujos modelos não são
linearizáveis. Buscaremos fazer uma breve apresentação das
ideias de forma suscinta tendo como referência Chapra e Canale
(2011). Dessa forma, ao leitor interessado em uma discussão
com mais detalhes, indicamos os referidos autores.
No problema da poupança discutimos o ajuste por meio
de uma função não linear que permitia ser linearizada e
transformada em um ajuste linear. Evidentemente, estamos
falando da linearidade com relação aos parâmetros que
aparecem na função em questão.

23
MT Ciência – Série Livros

Porém, muitas vezes não conseguimos fazer esse tipo


de transformação, e os valores dos parâmetros devem ser
determinados numericamente. Uma questão muito importante é
garantir a convergência desse tipo de ajuste. Por exemplo, a
função
𝛼0
𝑓 (𝑥; 𝛼0 , 𝛼1 , 𝛼2 ) = (15)
1 + 𝛼1 𝑒 −𝛼2 𝑥
conhecida como curva logística em que 𝛼0 pode ser interpretado
como a capacidade suporte do modelo (valor assintótico), 𝛼1 é
uma aproximação para a razão (𝑣𝑎𝑙𝑜𝑟 𝑎𝑠𝑠𝑖𝑛𝑡ó𝑡𝑖𝑐𝑜 −
𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙)/(𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙) e o parâmetro 𝛼2 representa a
taxa de crescimento, para mais detalhes, indicamos
(BASSANEZI, 2019).
Chamamos a atenção ao fato de que em muitos modelos
não lineares a linearização com relação aos parâmetros se torna
muito complicada (ou até mesmo impossível). Contudo,
podemos discutir os critérios de convergência desse tipo de
ajuste aos dados tabelados.
Por conveniência didática abordaremos o caso de
modelo não linear com três parâmetros, os casos com maior
número de parâmetros podem ser discutidos de maneira análoga.
Inicialmente, devemos notar que os dados experimentais serão

24
MT Ciência – Série Livros

aproximados pela função não linear dada, com isso obtemos a


seguinte igualdade

𝑦𝑖 = 𝑓(𝑥𝑖 ) + 𝜖𝑖 (16)

em que 𝑦𝑖 são os valores observados/tabelados e 𝜖𝑖 é o erro em


cada ponto observado.
Podemos pensar na linearização de modelos não
lineares utilizando a expansão em série de Taylor. Construímos
esta série considerando os parâmetros como variáveis
independentes e a expansão será obtida em torno das
aproximações iniciais (valores iniciais dos parâmetros) com
truncamento na derivada de primeira ordem, isto é,
𝜕𝑓(𝑥𝑖 )𝑗 𝜕𝑓(𝑥𝑖 )𝑗 𝜕𝑓(𝑥𝑖 )𝑗 (17)
𝑓(𝑥𝑖 )𝑗+1 = 𝑓(𝑥𝑖 )𝑗 + δ0 + δ1 + δ
𝜕𝛼0 𝜕𝛼1 𝜕𝛼2 2
Em que δ𝑘 = 𝛼𝑘,𝑗+1 − 𝛼𝑘,𝑗 , com 𝑘 = 0,1,2, e 𝑗 é um índice de
iteração que será utilizado na obtenção dos parâmetros de
maneira recursiva. Substituindo a igualdade (17) na equação
(16), segue que
𝜕𝑓(𝑥𝑖 )𝑗 𝜕𝑓(𝑥𝑖 )𝑗 𝜕𝑓(𝑥𝑖 )𝑗 (18)
𝑦𝑖 − 𝑓(𝑥𝑖 )𝑗 = δ0 + δ1 + δ2 + 𝜖 𝑖
𝜕𝛼0 𝜕𝛼1 𝜕𝛼1
Matricialmente, a igualdade (18) assume a forma

𝑌 = 𝐹𝑗 Δ𝛼 + 𝜖 (19)

25
MT Ciência – Série Livros

onde 𝐹𝑗 é a matriz com as derivadas parciais da função com


relação aos parâmetros, aplicada em cada ponto na aproximação
𝑗, isto é,
𝜕𝑓 (𝑥1 ) 𝜕𝑓 (𝑥1 ) 𝜕𝑓 (𝑥1 )
𝜕𝛼0 𝜕𝛼1 𝜕𝛼2
𝜕𝑓 (𝑥2 ) 𝜕𝑓 (𝑥2 ) 𝜕𝑓 (𝑥2 )
𝐹𝑗 = 𝜕𝛼0 𝜕𝛼1 𝜕𝛼2
⋮ ⋮ ⋮
𝜕𝑓 (𝑥𝑛 ) 𝜕𝑓 (𝑥𝑛 ) 𝜕𝑓 (𝑥𝑛 )
[ 𝜕𝛼0 𝜕𝛼1 𝜕𝛼2 ]
onde 𝑛 é o número de pontos observados/tabelados. 𝑌 é o vetor
determinado pela diferença entre os valores tabelados e as
imagens dos pontos pela função, isto é,
𝑦1 − 𝑓(𝑥1 )
𝑦 − 𝑓(𝑥2 )
𝑌=[ 2 ]

𝑦𝑛 − 𝑓(𝑥𝑛 )
Δ𝛼 é o vetor com a diferença entre os valores dos parâmetros na
iteração (𝑗 + 1) e a iteração 𝑗, isto é,
δ0
Δα = [δ1 ]
δ2
Agora, podemos aplicar a teoria de mínimos quadrados
linear à equação (19) obtendo a equação.

(𝐹𝑗𝑇 𝐹𝑗 )𝛥𝛼 = 𝐹𝑗𝑇 𝑌 (20)

26
MT Ciência – Série Livros

Do Teorema 2 segue que

𝛥𝛼 = (𝐹𝑗𝑇 𝐹𝑗 )−1 𝐹𝑗𝑇 𝑌 (21)

Observe que a solução dada pela equação (21) determina os


valores de δ0 , δ1 e δ2 . Finalmente, obtemos as aproximações
para 𝛼0 , 𝛼1 e 𝛼2 a partir das relações recursivas
𝛼0,𝑗+1 = 𝛼0,𝑗 + δ0
{ 𝛼1,𝑗+1 = 𝛼1,𝑗 + δ1
𝛼2,𝑗+1 = 𝛼2,𝑗 + δ2
esse procedimento iterativo é repetido até que o erro
𝛿𝑖
𝑚𝑎𝑥 |𝜖𝛼 |𝑖 = 𝑚𝑎𝑥 | |
𝛼𝑖,𝑗+1
seja inferior a uma precisão dada.
Por exemplo, vamos ajustar os valores da Tabela 5 a
seguir pela curva logística (15), considerando uma precisão de
0.01 para convergência dos parâmetros.

Tabela 5. Dados hipotéticos para regressão não linear


𝑥 0 1 2 3 4 5 6 7 8
𝑦 0.94 1.6 2.65 3.15 3.8 3.89 3.79 4.2 4
(Fonte: Elaborado pelos autores).

Primeiro, devemos observar que as derivadas parciais


do modelo não linear (15) são

27
MT Ciência – Série Livros

𝜕𝑓(𝑥) 1
=
𝜕𝛼0 1 + 𝛼1 𝑒 −𝛼2 𝑥

𝜕𝑓(𝑥) 𝛼0 𝑒 −𝛼2 𝑥
=−
𝜕𝛼1 (1 + 𝛼1 𝑒 −𝛼2𝑥 )2

𝜕𝑓(𝑥) 𝛼0 𝛼1 𝑥𝑒 −𝛼2 𝑥
=
𝜕𝛼2 (1 + 𝛼1 𝑒 −𝛼2 𝑥 )2

Considerando 𝛼0 = 4 a capacidade suporte (valor


assintótico), 𝛼1 = 3.5, uma aproximação para a razão
(𝑣𝑎𝑙𝑜𝑟 𝑎𝑠𝑠𝑖𝑛𝑡ó𝑡𝑖𝑐𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙)/(𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙) e o
parâmetro 𝛼2 = 1 a taxa de crescimento. Tomando estes valores
como aproximações iniciais para os parâmetros e substituindo as
derivadas parciais na matriz 𝐹𝑗 em cada ponto 𝑥𝑖 da Tabela 5,
temos
0.222222 −0.197531 0
0.437144 −0.281199 0.984196
0.678576 −0.249269 1.74488
0.851604 −0.144428 1.5165
𝐹1 = 0.939757 −0.064701 0.905819
0.976961 −0.025724 0.450173
0.991399 −0.009745 0.204649
0.996819 −0.003624 0.088796
[0.998827 −0.001338 0.037483]
Substituindo os valores de 𝑦𝑖 tabelados e as imagens
𝑓 (𝑥𝑖 ) do modelo logístico para cada 𝑥𝑖 na matriz 𝑌, obtemos
28
MT Ciência – Série Livros

0.94 − 0.88888 0.05112


1.6 − 1.74857 −0.14857
2.65 − 2.71431 −0.06431
3.15 − 3.40642 −0.25642
𝑌 = 3.8 − 3.75903 = 0.04097
3.89 − 3.90784 −0.01784
3.79 − 3.9656 −0.1756
4.2 − 3.98727 0.21273
[ 4 − 3.99531 ] [ 0.00469 ]
Agora, substituímos 𝐹1 e 𝑌 na equação (21) e obtemos

0.040728
Δ𝛼 = [−0.0717402 ]
−0.120662

Finalmente, obtemos as aproximações

𝛼0,1 = 𝛼0,0 + δ0 = 4 + 0.040728 = 4.040728


{ 1,1 = 𝛼1,0 + δ1 = 3.5 − 0.0717402 = 3.4282598
𝛼
𝛼2,1 = 𝛼2,0 + δ2 = 1 − 0.120662 = 0.879338

Com erro:
𝛿0 0.040728
|𝜖𝛼 |0 = | |=| | = 0.01
𝛼0,1 4.040728

𝛿1 −0.0717402
|𝜖𝛼 |1 = | |=| | = 0.02
𝛼1,1 3.4282598

𝛿2 −0.120662
|𝜖 𝛼 |2 = | |=| | = 0.13
𝛼2,1 0.8793388

29
MT Ciência – Série Livros

Como o maior erro é superior à precisão dada (|𝜖𝛼 |2 =


0.13 > 0.01), repetimos o processo. Agora, considerando 𝛼0 =
4.040728, 𝛼1 = 3.4282598 e 𝛼2 = 0.879338, obtemos
0.225822 −0.20606 0
0.412724 −0.285685 0.979404
0.628695 −0.275142 1.88652
0.803128 −0.186361 1.91668
𝐹2 = 0.907652 −0.098794 1.35477
0.959482 −0.045822 0.78545
0.982774 −0.019953 0.410433
0.992778 −0.008451 0.202812
[ 0.99699 −0.003537 0.097022]
e,
0.94 − 0.912487 0.0275133
1.6 − 1.66771 −0.0677064
2.65 − 2.54039 0.109614
3.15 − 3.24522 −0.0952224
𝑌 = 3.8 − 3.66758 = 0.132424
3.89 − 3.877 0.0129958
3.79 − 3.97112 −0.181124
4.2 − 4.01154 0.188456
[ 4 − 4.02856 ] [−0.0285636]
Portanto, da equação (21), obtemos

0.00840756
Δ𝛼 = [ 0.0308252 ]
0.00929661

De onde segue que

30
MT Ciência – Série Livros

𝛼0,2 = 𝛼0,1 + δ0 = 4.040728 + 0.00840756 = 4.04914


{ 𝛼1,2 = 𝛼1,1 + δ1 = 3.4282598 + 0.0308252 = 3.45909
𝛼2,2 = 𝛼2,1 + δ2 = 0.879338 + 0.00929661 = 0.888635

Com erro:
𝛿0 0.00840756
|𝜖 𝛼 | 0 = | |=| | = 0.002
𝛼0,2 4.04914

𝛿1 0.0308252
|𝜖𝛼 |1 = | |=| | = 0.0089
𝛼1,2 3.45909

𝛿2 0.00929661
|𝜖 𝛼 |2 = | |=| | = 0.0104
𝛼2,2 0.888635

Como o maior erro é superior à precisão dada (|𝜖𝛼 |2 =


0.0104 > 0.01), repetimos o processo, considerando 𝛼0 =
4.04914, 𝛼1 = 3.45909 e 𝛼2 = 0.888635, obtemos

−0.000015
Δ𝛼 = [ 0.001008 ]
0.000170187

De onde segue que

𝛼0,3 = 𝛼0,2 + δ0 = 4.04914 − 0.000015 = 4.049125


{ 𝛼1,3 = 𝛼1,2 + δ1 = 3.45909 + 0.001008 = 3.460098
𝛼2,3 = 𝛼2,2 + δ2 = 0.888635 + 0.000170 = 0.888805

31
MT Ciência – Série Livros

Com erro:
𝛿0 −0.000015
|𝜖 𝛼 |0 = | |=| | = 0.000003
𝛼0,3 4.049125

𝛿1 0.001008
|𝜖𝛼 |1 = | |=| | = 0.00029
𝛼1,2 3.460098

𝛿2 0.000170
|𝜖 𝛼 | 2 = | |=| | = 0.00019
𝛼2,3 0.888805

como o maior dos erros é menor do que a precisão dada (|𝜖𝛼 |1 =


0.00029 < 0.01), segue que os parâmetros são: 𝛼0 =
4.049125, 𝛼1 = 3.460098 e 𝛼2 = 0.888805. De onde segue
que a curva que ajusta os dados da Tabela 5, com a precisão
dada, é
4.049125 (22)
𝑦=
1 + 3.460098𝑒 −0.888805𝑥

Na Figura 6, apresentamos o diagrama de dispersão dos


valores da Tabela 5 e a curva de regressão logística (22).

32
MT Ciência – Série Livros

Figura 6. Diagrama de dispersão dos dados da Tabela 5 e curva de regressão.


(Fonte: Elaborado pelos autores).

Coeficiente de Determinação 𝑹𝟐
Ao realizarmos um ajuste de curvas é razoável
pensarmos em uma medida que permita quantificar o erro do
modelo com relação à variância dos valores apresentados.
Partindo do princípio: quanto menor o erro melhor é o modelo,
podemos atribuir métricas em função do erro para qualificar o
modelo. Essencialmente, uma medida muito utilizada é o
coeficiente de determinação R-quadrado (𝑅2 ) que é definido por
Bussab e Morettin (2011 apud MALAVAZI; SHENG, 2020, p.
39), como
∑𝑛𝑖=1(𝑓 (𝑥𝑖 ) − 𝑦𝑖 )2
𝑅2 = 1 − (23)
∑𝑛𝑖=1(𝑦 − 𝑦𝑖 )2

33
MT Ciência – Série Livros

em que:
• 𝑦 é a média dos valores 𝑦𝑖 ;
• ∑𝑛𝑖=1(𝑓 (𝑥𝑖 ) − 𝑦𝑖 )2 é a soma de quadrados dos resíduos;
• ∑𝑛𝑖=1(𝑦 − 𝑦𝑖 )2 é a soma de quadrados totais, que é
proporcional à variância.
Observe que, 0 ≤ 𝑅2 ≤ 1. No entanto, se o modelo 𝑓 utilizado
no cálculo for “pior” que o modelo obtido pela média 𝑦 teremos
𝑅2 negativo, mas este fato não ocorre na prática.
Em geral, quanto mais próximo de 1 for o coeficiente
de determinação, melhor é a qualidade do ajuste aos valores
observados. Advertimos que não temos o propósito de discutir
os aspectos teóricos sobre o coeficiente de determinação 𝑅 2 , por
não ser o foco principal deste livro, ao leitor interessado em uma
discussão mais detalhada indicamos (SHAFER; ZHANG, 2021;
RAWLINGS; PANTULA; DICKEY, 1998; ORLOFF;
BLOOM, 2014; HOFFMANN, 2016).
No que segue, efetuaremos os cálculos do coeficiente
de determinação 𝑅2 para os casos: Problema do IDEB e
Problema da Poupança. Estes conteúdos já foram apresentados
em seções anteriores deste capítulo.

Problema do IDEB

34
MT Ciência – Série Livros

Como visto na seção Regressão Linear, a função que


ajusta os valores é
𝑦 = 0.10119𝑥 − 199.49524
e a média dos valores 𝑦𝑖 é
𝑦 = 4.1
Na Tabela 6, dispomos os valores de forma conveniente
para utilização da fórmula (23). Na última linha da tabela
apresentamos os valores dos somatórios utilizados na referida
fórmula.
Tabela 6. Dados do problema do IDEB ajustados aos termos da fórmula (23)
ANO (𝒙𝒊 ) IDEB (𝒚𝒊 ) 𝒇(𝒙𝒊 ) (𝒇(𝒙𝒊 ) − 𝒚𝒊 )𝟐 ( 𝒚 − 𝒚𝒊 ) 𝟐
2005 2.9 3.39071 0.24080 1.44000
2007 3.6 3.59309 0.00005 0.25000
2009 4.2 3.79547 0.16364 0.01000
2011 4.3 3.99785 0.09129 0.04000
2013 4.2 4.20023 0.00000 0.01000
2015 4.5 4.40261 0.00948 0.16000
2017 4.6 4.60499 0.00002 0.25000
2019 4.5 4.80737 0.09448 0.16000
∑ 16096 32.8 – 0.59976 2.32000
(Fonte: Elaborado pelos autores).

Assim,
∑(𝑓(𝑥𝑖 ) − 𝑦𝑖 )2 = 0.59977
e
∑(𝑦 − 𝑦𝑖 )2 = 2.32
Substituindo os respectivos valores na fórmula (23), obtemos
35
MT Ciência – Série Livros

0.59977
𝑅2 = 1 − = 0.74148
2.32

Problema da Poupança
Como visto na seção Regressão Não Linear (Caso
Linearizável), a função que ajusta os valores é
𝑦 = 5 192.653𝑒 0.129𝑥
e a média dos valores 𝑦𝑖 é
𝑦 = 16 147.20
Na Tabela 7, dispomos os valores de forma conveniente
para utilização da fórmula (23). Na última linha da tabela
apresentamos os valores dos somatórios utilizados na referida
fórmula.

36
MT Ciência – Série Livros

Tabela 7. Dados do problema da poupança ajustados para utilização na


fórmula (23)
Tempo Capital
𝒇(𝒙𝒊 ) (𝒇(𝒙𝒊 ) − 𝒚𝒊 )𝟐 (𝒚 − 𝒚𝒊 )𝟐
(𝒙𝒊 ) (𝒚𝒊 )
0 5 000 5 192.65 37 114.02 124 260 067.84
1 5 800 5 907.63 11 584.22 107 064 547.84
2 6 696 6 721.05 627.50 89 325 181.44
3 7 699.52 7 646.47 2 814.30 71 363 297.38
4 8 823.46 8 699.32 15 410.74 53 637 167.59
5 10 082.28 9 897.13 34 280.52 36 783 254.61
6 11 492.15 11 259.87 53 954 21 669 490.50
7 13 071.21 12 810.24 68 150.34 9 461 714.48
8 14 839.75 14 574.08 70 580.55 1 709 425.50
9 16 820.53 16 580.79 57 475.27 453 373.29
10 19 038.99 18 863.80 30 691.54 8 362 449.4
11 21 523.67 21 461.16 3 907.50 28 906 429.66
12 24 306.51 24 416.15 12 020.93 66 574 339.68
13 27 423.29 27 778.01 125 826.28 127 150 205.69
14 30 914.08 31 602.77 474 293.92 218 060 744.93
15 34 823.77 35 954.16 1 277 781.55 348 814 266.96
∑ 120 258 355.21 – 2 276 513.18 1 313 595 956.79
(Fonte: Elaborado pelos autores).

Assim,
∑(𝑓(𝑥𝑖 ) − 𝑦𝑖 )2 = 2 276 513.18
e
∑(𝑦 − 𝑦𝑖 )2 = 1 313 595 956.79
Substituindo os respectivos valores na fórmula (23), obtemos

2 276 513.18
𝑅2 = 1 − = 0.998
1 313 595 956.79

37
MT Ciência – Série Livros

Note que, neste caso temos um ajuste razoavelmente


melhor do que o obtido para os valores do problema do IDEB.
Uma comparação da Figura 3 com a Figura 5 indica que já seria
esperado esse resultado. Entretanto, em alguns casos, obter
novos modelos com o coeficiente de determinação 𝑅2 mais
próximo de um ou até mesmo 𝑅2 = 1 pode não significar uma
melhoria no modelo. Efetivamente, vejamos o exemplo disposto
na Figura 7. Note que os dados possuem uma tendência linear
com pequenos desvios. Por outro lado, no modelo linear temos
𝑅2 = 0.79, enquanto no modelo polinomial de grau sete temos
𝑅2 = 1.

Figura 7. Contrastação entre as regressões linear e Polinomial de grau sete.


(Fonte: Elaborado pelos autores).

38
MT Ciência – Série Livros

39
MT Ciência – Série Livros

Capítulo 2
ANÁLISE DE REGRESSÃO NO GEOGEBRA

Em relação a análise de regressão, o software


matemático GeoGebra é uma ferramenta dinâmica com
interfaces que permitem uma integração entre planilhas (dados
tabulados), representações algébricas e geométricas. Com os
dados relacionados em pares ordenados (𝑥𝑖 , 𝑦𝑖 ) na planilha,
criamos uma lista de pontos que permite a visualização
geométrica dos respectivos pontos no plano cartesiano.
Utilizando a ferramenta de regressão na janela de álgebra,
obtemos as representações analítica (na janela de álgebra) e
geométrica (na janela de visualização) da regressão desejada,
veja a Figura 8.
Com o comando RQuadrado(<Lista de Pontos>,
<Função>) obtemos o coeficiente de determinação 𝑅2 , em que a
primeira entrada “<Lista de Pontos>” corresponde a lista de
dados tabulados e a segunda entrada “<Função>” corresponde a
expressão analítica obtida na regressão, veja a Figura 9.

40
MT Ciência – Série Livros

Figura 8. Integração entre planilha, álgebra e geometria no GeoGebra.


(Fonte: Elaborado pelos autores).

Figura 9. Cálculo do coeficiente de determinação 𝑅2 no GeoGebra. (Fonte:


Elaborado pelos autores).

No que segue, apresentamos o passo a passo com


ilustrações de vários cenários utilizando os recursos do
GeoGebra referentes à análise de regressão.
41
MT Ciência – Série Livros

Planilhas no GeoGebra
A planilha do GeoGebra possui recursos básicos
semelhantes às planilhas eletrônicas comuns: Excel, Calc
(LibreOffice), Planilhas Google, entre outras. Para abrir a
planilha eletrônica, é necessário acessar o menu no canto
superior direito da janela (três pequenas barras horizontais
paralelas) e clicar em “exibir” e posteriormente selecionar
“planilha”, veja a Figura 10.
Além de dispor das ferramentas básicas comuns às
outras planilhas eletrônicas citadas, apresentamos aqui a
integração dinâmica da planilha do GeoGebra com as janelas de
álgebra e visualização. Esta integração é um dos principais
atributos do software.

Figura 10. Acesso à exibição da planilha no menu do GeoGebra. (Fonte:


Elaborado pelos autores).

42
MT Ciência – Série Livros

Dado um conjunto de observações quantitativas de


duas variáveis aleatórias relacionadas em uma tabela, podemos
descrever esta relação de forma geométrica por meio de pontos
(correspondente a cada par ordenado de dados) dispersos no
plano cartesiano. Neste sentido, usaremos a ferramenta “criar
lista de pontos” para a integração entre os dados tabulados na
planilha e a respectiva representação geométrica na janela de
visualização. Considere a Tabela 8 com dados hipotéticos da
altura de uma árvore ao longo de 60 meses após o plantio da
muda.
Tabela 8. Dados hipotéticos da altura de uma árvore ao longo de 60 meses
após o plantio da muda
Tempo (meses) Altura (cm)
0 20
6 26
12 39
18 54
24 72
30 94
36 133
42 152
48 160
54 165
60 167
(Fonte: Elaborado pelos autores).

Após a inserção dos dados na planilha, com a


ferramenta criar lista de pontos, é possível exibi-los na janela de
visualização seguindo os passos na sequência.

43
MT Ciência – Série Livros

• Selecione as colunas de dados;


• Com o cursor do mouse no canto inferior direito da
seleção (como em outras planilhas eletrônicas
tradicionais, o cursor mudará de “seta” para “+”), clique
com o botão direito e escolha a opção “criar” e depois
“lista de pontos”, veja a Figura 11.
A lista de pontos com os dados estatísticos será criada
na janela de álgebra e os pontos estarão dispostos no plano
cartesiano da janela de visualização, veja a Figura 12.

Figura 11. Criando lista de pontos a partir da planilha do GeoGebra. (Fonte:


Elaborado pelos autores).

44
MT Ciência – Série Livros

Figura 12. Lista de pontos na janela de visualização do GeoGebra. (Fonte:


Elaborado pelos autores).

Regressão Linear no GeoGebra


Agora, com os dados listados na janela de álgebra, para
obter a respectiva regressão linear usamos o recurso
“RegressãoLinear(<Lista de Pontos>)”, como disposto na
Figura 13.

45
MT Ciência – Série Livros

Figura 13. Regressão linear de uma lista de pontos no GeoGebra. (Fonte:


elaborado pelos autores).

Ao escolher a respectiva lista de pontos (l1 no nosso


caso, isto é, usando o comando “RegressãoLinear(l1)”) a reta de
regressão será exibida de forma geométrica na janela de
visualização e de forma analítica na janela de álgebra, veja a
Figura 14. A regressão linear obtida dos dados relacionados na
Tabela 8 é
𝑦 = 2.9𝑥 + 11.5

46
MT Ciência – Série Livros

Figura 14. Representação da reta de regressão na janela de visualização do


GeoGebra. (Fonte: Elaborado pelos autores).

Caso o leitor considere interessante, é possível


“arrastar” o texto da janela de álgebra para a janela de
visualização. Este recurso possibilita a visualização da
expressão analítica da regressão linear na janela de visualização,
evidenciando a expressão algébrica, veja a Figura 15. Com o uso
deste recurso, a expressão matemática do texto é atualizada
simultaneamente com a respectiva equação da janela de álgebra.

47
MT Ciência – Série Livros

Figura 15. Arrastando texto da janela de álgebra para a janela de visualização


do GeoGebra. (Fonte: Elaborado pelos autores).

Coeficiente de Determinação 𝑹𝟐 no GeoGebra


No cálculo do coeficiente de determinação 𝑅2 de uma
regressão, usamos o recurso “RQuadrado(<Lista de Pontos>,
<Função>)”, veja a Figura 16.
Destacamos aqui que a função a ser inserida no segundo
argumento não necessariamente deve ser a curva obtida por
regressão (esta escolha vai depender do objetivo da análise), mas
sim o cálculo será efetuado independentemente do modelo
utilizado, podendo até ocorrer valores negativos de 𝑅2
dependendo da função escolhida. Por exemplo, se a lista de
pontos (primeiro argumento do comando) estiver dispersa com
tendência de uma função linear crescente e utilizarmos como
modelo uma linear decrescente (segundo argumento do
48
MT Ciência – Série Livros

comando), o valor obtido no coeficiente de determinação 𝑅 2 será


negativo.

Figura 16. Comando para calcular o coeficiente de determinação 𝑅2 no


GeoGebra. (Fonte: Elaborado pelos autores).

Ao escolher a lista de pontos e a função


(respectivamente, l1 e f), o coeficiente de determinação será
exibido na janela de álgebra. Por uma questão didática, o texto
contendo o coeficiente de determinação foi arrastado para a
janela de visualização, veja a Figura 17. Uma vantagem em fazer
isto, decorre do fato em que o texto na janela de visualização é
atualizado com o correspondente na janela de álgebra, sempre
que este último for alterado.

49
MT Ciência – Série Livros

Figura 17. Calculando o 𝑅2 de uma lista de pontos e a função de ajuste no


GeoGebra. (Fonte: Elaborado pelos autores).

Regressão Não Linear no GeoGebra


Considerando que os dados da Tabela 8, de certa forma,
representam uma população de células, o modelo linear não é
tão realista, uma vez que crescimentos populacionais possuem
variações não lineares. Na literatura é possível encontrar vários
modelos populacionais, destacamos aqui o modelo logístico que
é dado pela equação
𝑎
𝑦𝐿 =
1 + 𝑏𝑒 −𝛼𝑥

em que 𝑎, 𝑏 e α são constantes positivas. Assim, com o recurso


“RegressãoLogística(<Lista de Pontos>)” encontramos a
regressão logística referente aos dados da Tabela 8.

50
MT Ciência – Série Livros

180.27
𝑦𝐿 =
1 + 12.05𝑒 −0.09𝑥

Figura 18. Comparando o 𝑅2 do ajuste linear com o ajuste logístico. (Fonte:


Elaborado pelos autores).

Na Figura 18 podemos contrastar a regressão logística


com a regressão linear. Note que o coeficiente de determinação
para esta regressão é 𝑅2 = 0.99, enquanto na regressão linear o
respectivo coeficiente é 𝑅 2 = 0.96.
Levando em conta que a função logística considera um
valor inicial estritamente positivo, isto é, 𝑦𝐿 (0) = 𝑦0 > 0. Por
exemplo, quando estamos analisando o crescimento de uma
árvore a partir do momento da germinação da semente, a função
logística não contempla este condicionante. Assim,
consideremos agora os dados hipotéticos do crescimento de uma

51
MT Ciência – Série Livros

árvore a partir da germinação em um período de 66 meses como


disposto na Tabela 9.
Tabela 9. Dados hipotéticos da altura de uma árvore ao longo de 66 meses
após a germinação da semente
Tempo (meses) Altura (cm)
0 0
6 20
12 26
18 39
24 54
30 72
36 94
42 133
48 152
54 160
60 165
66 167
Fonte: Elaborado pelos autores.

Denominando esta nova lista de pontos como l2 e


efetuando a regressão logística com estes dados,
“RegressãoLogística(l2)”, verificamos que o GeoGebra não gera
a respectiva regressão de modo adequado, ou seja, a função de
regressão gerada é a função constante nula, ℎ(𝑥 ) = 0. Esta
situação de não regressão ocorre devido ao primeiro dado da
lista ser o ponto (0,0). Quando usamos a transformação
logarítmica, não é possível operar o valor zero. Dessa forma,
propomos um modelo adaptado 𝑦𝑁 com características próximas
da função logística 𝑦𝐿 , mas com a propriedade 𝑦𝑁 (0) = 0,

52
MT Ciência – Série Livros

1 1 (24)
𝑦𝑁 = 𝑎 ( −α𝑥
− )
1 + 𝑏𝑒 1+𝑏

Diferentemente do modelo logístico, que já é


predefinido nos recursos de regressão do GeoGebra, o modelo
𝑦𝑁 não possui esta praticidade. Assim sendo, a ferramenta
“Regressão(<Lista de Pontos>, <Função>)” nos permite efetuar
a regressão usando uma função modelo determinada pelo
usuário. Isto é, inserimos a função modelo (a ser usada na
regressão) na janela de álgebra com os respectivos parâmetros e
posteriormente usamos esta função na segunda entrada do
recurso “Regressão(<Lista de Pontos>, <Função>)”, veja a
Figura 19.

Figura 19. Regressão de uma lista de pontos utilizando uma função pré-
estabelecida no GeoGebra. (Fonte: Elaborado pelos autores).

53
MT Ciência – Série Livros

Apontamos duas observações a serem seguidas


referente aos parâmetros 𝑎, 𝑏 e 𝛼:
• A inserção dos parâmetros precisa ser no formato de
controles deslizantes e recomendamos que a inclusão
ocorra antes de inserir a função 𝑦𝑁 , veja a Figura 20.
• Os valores dos parâmetros devem ser ajustados de
modo a permitir a convergência, esta condição é bem
recorrente em Cálculo Numérico, como apresentado na
seção Regressão Não Linear (Caso Não Linearizável)
do primeiro capítulo. Aqui, usamos como valores
iniciais de parâmetros 𝑎 = 172.39, 𝑏 = 37.33 e α =
0.1231.

Figura 20. Criando controles deslizantes no GeoGebra. (Fonte: Elaborado


pelos autores).

54
MT Ciência – Série Livros

Estes valores foram obtidos da solução numérica do


seguinte sistema não linear em 𝑎, 𝑏 e 𝛼, que é equivalente a
encontrar numericamente a curva interpoladora do modelo (24)
com os pontos 𝐸 = (24, 54), 𝐼 = (48, 152) e 𝐿 = (66, 167),
conforme imagem disposta na Figura 21.
1 1
𝑦𝑁 (24) = 𝑎 ( −α∙24
− ) = 54
1 + 𝑏𝑒 1+𝑏
1 1
𝑦𝑁 (48) = 𝑎 ( −α∙48
− ) = 152
1 + 𝑏𝑒 1+𝑏
1 1
𝑦𝑁 (66) = 𝑎 ( − ) = 167
{ 1 + 𝑏𝑒 −α∙66 1 + 𝑏

Figura 21. Curva interpoladora do modelo (24) com os pontos 𝐸 = (24, 54),
𝐼 = (48, 152) e 𝐿 = (66, 167). (Fonte: Elaborado pelos autores).

A escolha dos parâmetros iniciais pelo método de


interpolação de alguns pontos apenas propicia uma boa chance
de convergência satisfatória. Entretanto, este método muitas
55
MT Ciência – Série Livros

vezes se torna uma tarefa complicada, assim sendo, outros


valores podem ser inseridos de modo a permitir a convergência.
Assim, efetuando a regressão do modelo (24) com os
dados da Tabela 9 e calculando o coeficiente de determinação
𝑅2 , obtemos
1 1
𝑦𝑁 = 196.58 ( −0.08𝑥
− ) e 𝑅2 = 0.99
1 + 13.49𝑒 1 + 13.49
Na Figura 22 apresentamos o diagrama de dispersão do conjunto
de pontos, a curva de regressão e seu respectivo coeficiente de
determinação.

Figura 22. Curva de regressão logística na janela de visualização do


GeoGebra. (Fonte: Elaborado pelos autores).

56
MT Ciência – Série Livros

57
MT Ciência – Série Livros

Capítulo 3
MODELAGEM: DADOS EXPERIMENTAIS

No que tange ao estudo de regressões lineares e não


lineares em dados experimentais, apresentamos várias
abordagens com o GeoGebra para analisar casos com dados reais
extraídos de experimentos científicos nas diversas áreas das
ciências. Além das regressões, também iremos calcular o
coeficiente de determinação 𝑅2 , que, embora seja um dispositivo
de comparação entre modelos não faremos discussões a este
respeito, tampouco a validação dos modelos obtidos. Uma vez
que estes são assuntos que requerem discussões amplas e fogem
do escopo deste texto. Assim, apresentamos apenas mecanismos
práticos de como efetuar esses cálculos com o software
GeoGebra. Destacamos aqui uma integração entre planilhas
(dados tabulados), representações analíticas de modelos e
representação gráfica, tanto dos dados tabulado (diagrama de
dispersão) quanto do modelo (gráfico da função).

58
MT Ciência – Série Livros

Lei de Hooke
A Lei de Hooke determina que em um sistema massa-
mola, pequenas deformações (compressão ou esticamento) Δ𝑥,
a força que a mola exerce sobre a massa é dada por
𝐹 = −𝑘Δ𝑥
em que 𝑘 é a constante elástica da mola cujo valor é positivo e
obtido de modo experimental. No que segue, apresentamos o
cálculo da constante elástica através de dados experimentais
coletados no Laboratório de Ensino de Física da Universidade
Federal do Mato Grosso Câmpus de Sinop.
Tabela 10. Relação entre a Força Elástica e a distensão da mola
Massa Distensão da mola Força elástica
(g) (metros) (N)
0 0 0
106.161 0.02 1.04
205.932 0.038 2.18
305.647 0.055 2.995
405.397 0.075 3.973
(Fonte: Projeto de Ensino “Cálculo I: Produção de banco de questões com
feedback no Ambiente Virtual de Aprendizagem” UFMT Sinop, Processo
SEI 23108.046317/2020-41. Professor Yuri Alexandrovich Barbosa).

O experimento constitui-se de uma mola na posição


vertical com uma extremidade fixada e massas variadas
encaixadas na outra extremidade. Mais precisamente, as forças
usadas nas distensões da mola foram as respectivas forças pesos
determinadas pelas massas. Veja os dados experimentais na
Tabela 10.

59
MT Ciência – Série Livros

Por uma questão didática, tanto os valores da força


elástica quanto da distensão da mola apresentados na tabela são
positivos. A finalidade desta escolha é trabalhar com a função
linear crescente que, por sua vez, possui representação
geométrica mais agradável e receptiva para o leitor. Para
encontrar a constante elástica, faremos uma regressão com o
modelo a seguir.

𝑦 = 𝑘𝑥 (25)

Note que, esta função possui apenas um grau de


liberdade, enquanto o comando nativo de regressão linear do
GeoGebra, “RegressãoLinear(<Lista de Pontos>)” engloba dois
graus de liberdade, 𝑦 = 𝑎𝑥 + 𝑏.
Usando o comando nativo de regressão linear do
GeoGebra e posteriormente calculando o coeficiente de
determinação 𝑅 2 , obtemos

𝑦 = 53.488𝑥 − 0.006 e 𝑅 2 = 0.999 (26)

Portanto, o valor da constante elástica é 𝑘 = 53.488.


Na Erro! Fonte de referência não encontrada. apresentamos
o diagrama de dispersão do conjunto de pontos, a curva de
regressão e seu respectivo coeficiente de determinação.

60
MT Ciência – Série Livros

Figura 23. Modelo linear para a força elástica com dois graus de liberdade
(Fonte: Elaborado pelos autores).

Um fato importante a ser analisado na expressão (26),


é que este modelo produz incompatibilidade física em alguns
casos. Efetivamente, usando o coeficiente linear 𝑏 = −0.006,
para distensões muito próximas de zero, o erro relativo é muito
alto, ou até mesmo o valor da força elástica pode ser negativo,
gerando contradições teóricas. Desse modo, podemos usar a
constante elástica obtida em (26) sem o coeficiente linear, isto é,
𝑦 = 53.488𝑥.
Uma outra possibilidade é efetuar a regressão
diretamente com o modelo (25) usando a ferramenta
“Regressão(<Lista de Pontos>, <Função>)”. Assim, aplicando a

61
MT Ciência – Série Livros

ferramenta nas respectivas entradas e posteriormente calculando


o coeficiente de determinação 𝑅2 , obtemos

𝑦 = 53.381𝑥 e 𝑅2 = 0.999 (27)

Na Figura 24 apresentamos o diagrama de dispersão do


conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação. Aumentando a precisão para seis
algarismos significativos obtemos R2 = 0.999466 na regressão
(26) e 𝑅2 = 0.999460 na regressão (27).

Figura 24. Modelo linear para a força elástica com um grau de liberdade.
(Fonte: Elaborado pelos autores).

Embora o modelo linear com um grau de liberdade, isto


é, 𝑦 = 𝑎𝑥, seja bastante comum na literatura, destacamos que o
GeoGebra não possui este tipo de regressão previamente
definido. Por este motivo, usamos a ferramenta

62
MT Ciência – Série Livros

“Regressão(<Lista de Pontos>, <Função>)” na obtenção da


regressão (27). Para estudos mais detalhados da Lei de Hooke
indicamos Tipler e Mosca (2009) e Resnick, Halliday e Krane
(2003).

Produção de Soja
O potássio é um dos principais nutrientes encontrados
em fertilizantes agrícolas. Sendo ele responsável por manter a
planta mais resistente a períodos de seca.

Na literatura de nutrição de plantas é conhecido


que o potássio está envolvido na abertura dos
estômatos da planta atuando assim no controle
da transpiração. Quando a planta está bem
nutrida desse nutriente, espera-se uma menor
perda de água devido à transpiração e por isso
uma maior capacidade de suportar períodos mais
longo sem água. Sendo assim, em regiões cujo
risco de déficit hídrico é alto, uma adubação com
potássio nas culturas poderia ser uma forma de
minimizar os prejuízos da escassez de água.
(SERAFIM et al., 2012, p. 57)

Apresentamos abaixo parte dos dados experimentais de


Serafim et al. (2012 apud ZEVIANI; RIBEIRO JR; BONAT,
2013) referente ao Rendimento de grãos (g/vaso) de soja em
função do conteúdo de potássio no solo (mg/dm3) na faixa de
umidade entre 35% e 40% da capacidade de campo.

63
MT Ciência – Série Livros

Tabela 11. Rendimento de grãos (g/vaso) de soja em função do conteúdo de


potássio no solo (mg/dm3) na faixa de umidade entre 35% e 40% da
capacidade de campo
Potássio Rendimento de grãos (g/vaso)
(mg/dm3). I II III IV V Média
0 14.55 15.72 12.77 14.26 10.30 13.52
30 21.51 19.72 20.45 23.71 16.28 20.33
60 24.62 24.29 24.35 22.76 23.61 23.93
120 21.88 25.39 27.15 22.46 29.66 25.31
180 28.11 28.45 24.08 22.97 23.34 25.39
(Fonte: SERAFIM et al., 2012, apud ZEVIANI; RIBEIRO JR; BONAT,
2013, p. 58).

Por meio de um diagnóstico dos dados, no intervalo de


0 mg a 60 mg de potássio por dm3 de solo, notamos um aumento
significativo no rendimento, enquanto no intervalo entre 60 mg
e 180 mg de potássio por dm3 de solo temos uma estabilização
(platô) no rendimento. Assim, para este conjunto de dados,
efetuamos uma série de regressões não lineares com esta
característica, isto é, apresentamos funções com alto
crescimento no primeiro terço do domínio e baixo crescimento
ou constante no restante do domínio.
Evidenciamos que o valor do domínio 𝑥0 = 60 não é
efetivamente onde ocorre a mudança na monotonicidade. Este
valor é apenas um indicador inicial para a análise. Destacamos
alguns modelos com a especificidade acima descrita, existência
de platô:

64
MT Ciência – Série Livros

• Logístico
𝑎 (28)
𝑦𝐿 =
1 + 𝑏𝑒 −𝛼𝑥
• Linear Platô
𝑎𝑥 + 𝑏, 𝑠𝑒 0 ≤ 𝑥 ≤ 𝑥0 (29)
𝑦𝐿𝑃 = {
𝑝 = 𝑎𝑥0 + 𝑏, 𝑠𝑒 𝑥 > 𝑥0
• Quadrático Platô
−𝑏
𝑎𝑥 2 + 𝑏𝑥 + 𝑐, se 0 ≤ 𝑥 ≤
2𝑎 (30)
yQP = {
−𝑏2 −𝑏
𝑝= + 𝑐, se 𝑥 >
4𝑎 2𝑎
• Linear Raiz Quadrada

𝑦𝐿𝑅 = 𝑎𝑥 + 𝑏 + 𝑐√𝑥 (31)

• Quadrático Raiz Quadrada

𝑦𝑄𝑅 = 𝑎𝑥 2 + 𝑏𝑥 + 𝑐 + 𝑑 √𝑥 (32)

Destacamos que não usaremos as médias, última coluna


da Tabela 11, nas regressões. Apenas inserimos os respectivos
pontos nas representações gráficas para uma contrastação visual
entre as médias e as curvas de regressão. Para diferenciá-los,
representamos estes pontos com cores distintas dos demais.
Modelo Logístico – Conforme efetuado na seção
anterior, após inserir os pontos na planilha do GeoGrebra e criar
a lista de pontos, aplicando a ferramenta
“RegressãoLogística(<Lista de Pontos>)” com os dados da
65
MT Ciência – Série Livros

Tabela 11 e posteriormente calculando o coeficiente de


determinação 𝑅 2 , obtemos
25.447 (33)
𝑦𝐿 = e 𝑅2 = 0.807
1 + 0.886𝑒 −0.043𝑥
Na Figura 25 apresentamos o diagrama de dispersão do conjunto
de pontos, a curva de regressão e seu respectivo coeficiente de
determinação.

Figura 25. Regressão logística dos dados da Tabela 11. (Fonte: Elaborado
pelos autores).

Modelo Linear Platô – Neste modelo, a função 𝑦𝐿𝑃 não


possui comando exclusivo no GeoGebra como ocorre no caso
logístico. Assim, é necessário usarmos a ferramenta
“Regressão(<Lista de Pontos>, <Função>)” inserindo o modelo
(29) no respectivo campo. Como estamos trabalhando com
convergência de regressões, são necessárias boas escolhas

66
MT Ciência – Série Livros

iniciais para os parâmetros 𝑎, 𝑏 e 𝑥0 . Neste caso, os parâmetros


iniciais escolhidos foram 𝑎 = 0.1735, 𝑏 = 13.52 e 𝑥0 = 60.
Efetivamente, os parâmetros 𝑎 = 0,1735 e 𝑏 = 13,52 são,
respectivamente, os valores dos coeficientes angular e linear da
reta que passa pelos primeiro e terceiro pontos formados pelas
médias, digamos 𝑀1 = (0, 13.52) e 𝑀3 = (60, 23.93). Já o
parâmetro 𝑥0 = 60 foi escolhido pelo fato de ser
aproximadamente nesse ponto que os dados coletados iniciam
um platô.
Para definir uma função por partes no GeoGebra
usamos a composição das ferramentas condicionais
“Se(<Condição>,<Então>,<Senão>)” e “Se(<Condição>,
<Então>)”. Na definição da função (29) usamos “Se(0≤x≤x_0,
ax+b, Se(x>x_0, ax_0+b))”. Efetuando a regressão do modelo
(29) com os dados da Tabela 11 e posteriormente calculando o
coeficiente de determinação 𝑅2 , obtemos

0.227𝑥 + 13.52, 𝑠𝑒 0 ≤ 𝑥 ≤ 49.991


𝑦𝐿𝑃 = { 𝑒 𝑅2 = 0.796
24.87, 𝑠𝑒 𝑥 > 49.991

Na Figura 26 apresentamos o diagrama de dispersão do


conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação.

67
MT Ciência – Série Livros

Figura 26. Regressão linear platô dos dados da Tabela 11. (Fonte: Elaborado
pelos autores).

Modelo Quadrático Platô – Em uma comparação entre


os modelos 𝑦𝐿𝑃 e 𝑦𝑄𝑃 , destacamos que ambos são contínuos por
partes. Porém, o segundo além de ser contínuo, também é
diferenciável, enquanto o primeiro não possui diferenciabilidade
na intersecção da função afim com o platô. Para encontrar um
conjunto de parâmetros 𝑎, 𝑏 e 𝑐 a fim de obter a convergência
do modelo (30), usaremos os coeficientes de uma função
quadrática interpolante aos três primeiros pontos referentes às
médias, digamos 𝑀1 = (0, 13.52), 𝑀2 = (30, 20.33) e 𝑀3 =
(60, 23.93). Por praticidade, omitiremos os cálculos da
interpolação e apenas exibimos a respectiva função interpolante,
𝑃(𝑥 ) = −0.00178𝑥 2 + 0.281𝑥 + 13.5. Logo, os parâmetros

68
MT Ciência – Série Livros

iniciais usados na convergência do modelo (30) são 𝑎 =


−0.00178, 𝑏 = 0.281 e 𝑐 = 13.5.
Aplicando a ferramenta de regressão
“Regressão(<Lista de Pontos>, <Função>)” com as respectivas
entradas e, posteriormente, calculando o coeficiente de
determinação R2 , obtemos
−0.00149𝑥 2 + 0.265𝑥 + 13.6, 𝑠𝑒 0 ≤ 𝑥 ≤ 88.751
𝑦𝑄𝑃 = {
25.321, 𝑠𝑒 𝑥 > 88.751
e
R2 = 0.807
Na Figura 27 apresentamos o diagrama de dispersão do
conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação.

Figura 27. Regressão quadrática platô dos dados da Tabela 11. (Fonte:
Elaborado pelos autores).

69
MT Ciência – Série Livros

Modelo Linear Raiz Quadrada – Uma propriedade do


modelo 𝑦𝐿𝑅 que merece destaque são os estágios do
crescimento-decrescimento da função. No primeiro estágio,
valores do domínio próximos de zero, a referente função tem
crescimento característico de uma função raiz quadrada. No
segundo estágio, setor intermediário do domínio, o fator linear
decrescente (no nosso caso) combinado com o fator raiz
quadrada anula o crescimento em um platô. Finalmente, no
terceiro estágio o fator linear decrescente se sobrepõe sobre o
fator raiz quadrada tornando a função decrescente.

Observamos que os dados da Tabela 11 estão apenas no


primeiro e segundo setor, ou seja, estágios de crescimento e
platô. Com o objetivo de encontrar “bons” valores iniciais para
os parâmetros 𝑎, 𝑏 e 𝑐, vamos resolver o sistema linear

𝑦𝐿𝑅 (0) = 𝑏 = 13.52


{ 𝑦𝐿𝑅 (60) = 60𝑎 + 𝑏 + √60𝑐 = 23.93 (34)
𝑦𝐿𝑅 (180) = 180𝑎 + 𝑏 + √180𝑐 = 25.39

Que é equivalente a encontrar a curva do modelo (31)


interpoladora aos pontos 𝑀1 = (0,13.52), 𝑀3 = (60,23.93) e
𝑀5 = (180,25.39).

70
MT Ciência – Série Livros

Resolvendo o sistema linear (34), temos os valores


aproximados 𝑎 = −0.0808, 𝑏 = 13.52 e 𝑐 = 1.97. Aplicando a
ferramenta “Regressão(<Lista de Pontos>, <Função>)” com as
respectivas entradas e posteriormente calculando o coeficiente
de determinação R2 , obtemos
𝑦𝐿𝑅 = −0.064𝑥 + 13.4 + 1.77√𝑥 e 𝑅2 = 0.797

Na Figura 28 apresentamos o diagrama de dispersão do


conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação.

Figura 28. Regressão linear raiz quadrada dos dados da Tabela 11. (Fonte:
Elaborado pelos autores).

Modelo Quadrático Raiz Quadrada – De modo


semelhante ao modelo 𝑦𝐿𝑅 , este modelo também possui os três
estágios: crescimento, platô e decrescimento. O diferencial do
71
MT Ciência – Série Livros

modelo 𝑦𝑄𝑅 é a existência de quatro graus de liberdade em


comparação com os três do modelo 𝑦𝐿𝑅 , e o fato da mudança de
estágios ser mais vertiginosa, isto é, para os mesmos dados
experimentais o gráfico do modelo 𝑦𝑄𝑅 é mais côncavo que o
gráfico do modelo 𝑦𝐿𝑅 .
Tal qual ao caso anterior, os dados da Tabela 11 estão
apenas nos primeiro e segundo estágios: crescimento e platô.
Para a obtenção dos valores iniciais dos parâmetros 𝑎, 𝑏, 𝑐 e 𝑑,
resolvemos o sistema linear
𝑦𝑄𝑅 (0) = 𝑐 = 13.52
𝑦𝑄𝑅 (30) = 900𝑎 + 30𝑏 + 𝑐 + √30𝑑 = 20.33
(35)
𝑦𝑄𝑅 (60) = 3600𝑎 + 60𝑏 + 𝑐 + √60𝑑 = 23.93
{𝑦𝑄𝑅 (180) = 32400𝑎 + 180𝑏 + 𝑐 + √180𝑑 = 25.39

Que é equivalente a encontrar a curva interpoladora do modelo


(32) aos pontos 𝑀1 = (0, 13.52), 𝑀2 = (30, 20.33), 𝑀3 =
(60, 23.93) e 𝑀5 = (180, 25.39).
Resolvendo o sistema (35), obtemos em valores
aproximados 𝑎 = −0.000593, 𝑏 = 0.123, 𝑐 = 13.52 e 𝑑 =
0.668. Aplicando a ferramenta “Regressão(<Lista de Pontos>,
<Função>)”, com as respectivas entradas e posteriormente
calculando o coeficiente de determinação R2 , obtemos

72
MT Ciência – Série Livros

𝑦𝑄𝑅 (𝑥 ) = −0.000237𝑥 2 + 0.012𝑥 + 13.5 + 1.29√𝑥


e
𝑅2 = 0.802
Na Figura 29 apresentamos o diagrama de dispersão do conjunto
de pontos, a curva de regressão e seu respectivo coeficiente de
determinação.

Figura 29. Regressão quadrática raiz quadrada dos dados da Tabela 11.
(Fonte: Elaborado pelos autores).

Para ilustrar geometricamente todas as regressões aqui


efetuadas com os dados da Tabela 11, apresentamos no mesmo
par de eixos os dados experimentais, as médias e as regressões
dos modelos (28) – (32), veja a Figura 30. Evidenciamos que,
embora os modelos possuam equações diversas, os ajustes são
bem próximos.

73
MT Ciência – Série Livros

Figura 30. Regressões dos modelos (28) – (32) com os dados da Tabela 11.
(Fonte: Elaborado pelos autores).

Temperatura do Solo
No estudo de sistemas geotérmicos, a temperatura do
solo abaixo de certa profundidade permanece constante ao longo
do ano, mais precisamente, as flutuações de temperatura na
superfície são diminuídas com a profundidade. Entretanto, em
zonas rasas, profundidades menores que um metro, a
temperatura é muito sensível as mudanças do clima acima da
superfície (VIVAS; GUERRA, 2021). Apresentamos na Tabela
12, os dados obtidos de Matteucci e Lobato (1996) referentes às
temperaturas médias mensais (°C) de um solo a uma
profundidade de 20 cm na cidade de Goiânia – GO
(MATTEUCCI; LOBATO, 1996 apud FERREIRA, 1999).

74
MT Ciência – Série Livros

Tabela 12. Temperaturas médias mensais (°C) de um solo sem cobertura


vegetal, a uma profundidade de 20 cm na cidade de Goiânia - GO
Mês Temperatura
Janeiro 24.67
Fevereiro 24.85
Março 24.80
Abril 23.93
Maio 23.72
Junho 20.66
Julho 20.23
Agosto 21.56
Setembro 22.96
Outubro 24.09
Novembro 24.89
Dezembro 24.10
(Fonte: MATTEUCCI; LOBATO, 1996 apud FERREIRA, 1999, p. 100).

Considerando que a mudança de temperatura ocorre de


forma periódica, com período de um ano, um bom modelo que
descreve este comportamento é o sinusoidal
𝑦𝑆 = 𝑎 + 𝑏 sen(𝑐 ∙ 𝑥 + 𝑑 )
em que os parâmetros 𝑎, 𝑏, 𝑐 e 𝑑 estão relacionados,
respectivamente, com o deslocamento vertical (no eixo 𝑦), a
amplitude, a frequência e o deslocamento horizontal (no eixo 𝑥).
O GeoGebra já possui o recurso de regressão sinusoidal pré-
definida.
Assim, aplicando a ferramenta
“RegressãoSinusoidal(<Lista de Pontos>)” na respectiva lista e,
posteriormente, calculando o coeficiente de determinação 𝑅2 ,
obtemos
75
MT Ciência – Série Livros

𝑦𝑆 = 22.923 + 2.133 sen(0.717𝑥 − 0.21) e 𝑅2 = 0.892


Na Figura 31 apresentamos o diagrama de dispersão do conjunto
de pontos, a curva de regressão e seu respectivo coeficiente de
determinação.

Figura 31. Regressão sinusoidal dos dados da Tabela 12. (Fonte: Elaborado
pelos autores).

Arremesso de Peso
O arremesso de peso é uma prova da modalidade de
competição de atletismo que consiste, basicamente, em
arremessar uma esfera metálica o mais longe possível. No
arremesso masculino a esfera oficial tem 7.26 kg de massa e
diâmetro de 12 cm, o arremessador tem um espaço circular de
2.135 m de diâmetro para se locomover e realizar o arremesso,
a marca obtida em cada lançamento é medida a partir do
primeiro lugar onde o peso bate no chão e a classificação é dada
76
MT Ciência – Série Livros

pela distância obtida no maior arremesso válido (BASSANEZI,


2015).
Uma questão que podemos abordar é a evolução dos
recordes alcançados nos arremessos ao longo da história. Assim,
na Tabela 13 a seguir apresentamos os recordes mundiais
masculinos no arremesso de peso no período de 1909 a 1990
(BASSANEZI, 2015).
Tabela 13. Recordes mundiais masculino no arremesso de peso
Tempo Ano Recorde Tempo Ano Recorde
0 1909 15.54 53 1962 20.08
19 1928 15.87 55 1964 20.68
22 1931 16.04 56 1965 21.52
23 1932 16.2 58 1967 21.78
25 1934 17.4 64 1973 21.82
39 1948 17.68 67 1976 22.00
40 1949 17.79 69 1978 22.15
41 1950 17.95 74 1983 22.22
44 1953 18.04 76 1985 22.62
45 1954 18.54 77 1986 22.64
47 1956 19.25 78 1987 22.91
50 1959 19.3 79 1988 23.06
51 1960 20.06 81 1990 23.12
(Fonte: BASSANEZI, 2015, p.167).

Utilizando o GeoGebra, é possível explorar alguns


aspectos referentes aos dados da Tabela 13, por exemplo,
podemos criar uma lista de pontos, plotar esses pontos na janela
gráfica e verificar que eles se comportam de forma linear.
Assim, aplicando a ferramenta “RegressãoLinear(<Lista de

77
MT Ciência – Série Livros

Pontos>)” na respectiva lista e, posteriormente, calculando o


coeficiente de determinação 𝑅2 , obtemos
𝑦𝑃 = 0.114𝑥 + 14.0103 e 𝑅2 = 0.94
Na Figura 32 apresentamos o diagrama de dispersão do conjunto
de pontos, a curva de regressão e seu respectivo coeficiente de
determinação.

Figura 32. Diagrama de dispersão e regressão linear para o problema do


arremesso de peso masculino. (Fonte: Elaborado pelos autores).

Criminalidade
Assunto inspirado em Bassanezi (2015), a
criminalidade é um tema de extrema relevância, pois pode afetar
diretamente a qualidade de vida da sociedade como um todo.
Normalmente, o índice de criminalidade é dado em função do
número de habitantes, é comum usar o número de homicídios
dolosos para cada cem mil habitantes como indicador. Com isso,
78
MT Ciência – Série Livros

é possível avaliar se a criminalidade de determinada região ou


cidade diminuiu ou aumentou durante um período de tempo,
bem como avaliar possíveis tendências (de alta ou de queda ou
de estabilidade) no comportamento da criminalidade.
Os dados sobre índices de criminalidade normalmente
podem ser obtidos na página oficial da secretaria de segurança
pública de cada estado. Na Tabela 14 a seguir encontram-se os
dados sobre a criminalidade dado pelo número de homicídios
dolosos por cem mil habitantes (hom/100mil) na cidade de
Campinas/SP, no período de 1999 até 2020.
Por conveniência didática, consideraremos o ano de
1999 como tempo 0, o ano de 2000 como tempo 1 e assim por
diante. Observe que essa mudança nos valores não afeta a
qualidade dos resultados obtidos.
Tabela 14. Índice de criminalidade em Campinas/SP
Ano Tempo hom/100mil Ano Tempo hom/100mil
1999 0 52.69 2010 11 14.55
2000 1 50.17 2011 12 13.39
2001 2 55.28 2012 13 13.08
2002 3 45.68 2013 14 12.23
2003 4 49.38 2014 15 12.91
2004 5 35.73 2015 16 10.67
2005 6 21.87 2016 17 10.06
2006 7 15.75 2017 18 11.91
2007 8 13.49 2018 19 11.67
2008 9 13.35 2019 20 11.56
2009 10 14.43 2020 21 10.45
(Fonte: São Paulo – Secretaria de Segurança Pública).

79
MT Ciência – Série Livros

A partir do diagrama de dispersão dos valores da Tabela


14 (veja Figura 33), é possível notar que nos tempos iniciais as
taxas eram altas com comportamento de tendência linear
seguidas de taxas com um decrescimento hiperbólico ou
exponencial até alcançar um comportamento de estabilidade.
Assim, realizamos uma regressão linear para o tempo
entre 0 e 4 e uma regressão do tipo função racional para os
tempos posteriores, mais precisamente, utilizamos uma função
do tipo

𝛼𝑥 + 𝛽, 𝑠𝑒 0 ≤ 𝑥 < 4
𝑔 (𝑥 ) = { 𝑎 (36)
, 𝑠𝑒 4 ≤ 𝑥 ≤ 21
𝑏𝑥 2 + 𝑐𝑥 + 𝑑

em que 𝛼, 𝛽, 𝑎, 𝑏, 𝑐 e 𝑑 são constantes.


Como a reta de regressão que ajusta os cinco primeiros
pontos tem inclinação aproximada de -1.11 usamos 𝛼 = −1.11,
os demais parâmetros definimos como sendo 1. Assim,
aplicando a ferramenta “Regressão(<Lista de Pontos>,
<Função>)” na respectiva lista e, posteriormente, calculando o
coeficiente de determinação 𝑅2 , obtemos
−1.11𝑥 + 52.62, se 0 ≤ 𝑥 < 4
𝑦𝐶 = { −924877.383
, se 4 ≤ 𝑥 ≤ 21
453.569𝑥 2 −14689.994𝑥+32986.21

80
MT Ciência – Série Livros

𝑅2 = 0.982
Na Figura 33 apresentamos o diagrama de dispersão do
conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação.
O modelo apresentado acima se ajusta bem ao conjunto
de valores tabelados. Porém, poderíamos ter pensado em um
ajuste com uma função potência no lugar da função quadrática.
Destacamos duas vantagens nesse tipo de modelo. Primeiro,
com a função potência no denominador, temos que o modelo não
possui descontinuidade no infinito para 𝑥 > 4, assíntota vertical.
A outra vantagem é o novo modelo possuir comportamento
assintótico horizontal, mais realista com relação ao conjunto de
dados.

Figura 33. Diagrama de dispersão e curva de regressão para o problema da


criminalidade na cidade de Campinas/SP. (Fonte: Elaborado pelos autores).

81
MT Ciência – Série Livros

Partindo da condição que a criminalidade estabiliza em


uma constante positiva, inserimos um parâmetro correspondente
ao deslocamento vertical da hipérbole. Assim, propomos uma
função do tipo
𝛼𝑥 + 𝛽, 𝑠𝑒 0 ≤ 𝑥 < 4
𝑔 (𝑥 ) = { 𝑏
𝑎+ 𝑐, 𝑠𝑒 4 ≤ 𝑥 ≤ +∞
𝑥

Em que 𝛼, 𝛽, 𝑎, 𝑏 e 𝑐 são constantes. Para a convergência do


modelo, ajustamos os parâmetros com 𝛼 = −1.11, 𝛽 = 1, 𝑎 =
1, 𝑏 = 1 e 𝑐 = 3. Assim, aplicando a ferramenta
“Regressão(<Lista de Pontos>, <Função>)” na respectiva lista e
posteriormente calculando o coeficiente de determinação 𝑅2 ,
obtemos

−1.11𝑥 + 52.62, se 0 ≤ 𝑥 < 4


𝑦𝐶 = { 2408.05 e 𝑅2 = 0.985
10.905 + , se 4 ≤ 𝑥 ≤ ∞
𝑥 2.962

Na Figura 34 apresentamos o diagrama de dispersão do


conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação.

82
MT Ciência – Série Livros

Figura 34. Diagrama de dispersão e curva de regressão assintótica para o


problema da criminalidade na cidade de Campinas/SP. (Fonte: Elaborado
pelos autores).

Uma das vantagens de uma função desse tipo é que ela


permite avaliar se há uma tendência de decrescimento
assintótico, o que não é possível com a função dada pela
Equação (36), pois ela apresenta duas assíntotas verticais nos
pontos em que 𝑏𝑥 2 + 𝑐𝑥 + 𝑑 = 0, no caso específico da função
obtida na regressão, uma das assíntotas ocorre em 𝑥 =
29.96014.

COVID-19
Tema muito discutido na atualidade em virtude da
pandemia causada pela COVID-19. Com a grande repercussão
sobre o comportamento da doença provocada pelo coronavírus

83
MT Ciência – Série Livros

vários pesquisadores se dedicaram ao estudo sobre essa doença


ao longo do tempo. Muitos esforços foram, e ainda são
concentrados em pesquisas que permitam compreender a
evolução do número de casos e do número de óbitos nos países
e no mundo, em geral.
Diante disso, abordaremos o tema COVID-19 a partir
dos estudos realizados por Assis, Mendonça e Assis (2020).
Mais precisamente, usaremos o GeoGebra como ferramenta para
efetuar o ajuste de regressão dos dados apresentados pelos
autores.
Assim, na Tabela 15 apresentamos os dados referentes
ao número total de casos (TC) no período de 03 de março de
2020 até 31 de maio de 2020, bem como o número total de óbitos
(TO) no período de 17 de março de 2020 até 31 de maio de 2020,
no Brasil.
No trabalho original, Assis, Mendonça e Assis (2020)
apresentam o ajuste de modelos discretos lineares e não lineares.
Mais precisamente, os autores discutem sobre os modelos
discretos de Malthus, Verhulst e Beverton-Holt, evidenciando as
características particulares de cada modelo e suas implicações
no processo de modelagem dos dados da COVID-19.
Como o foco principal deste livro é abordar o conceito
de ajuste de curvas com os recursos do GeoGebra, para isso
84
MT Ciência – Série Livros

abordaremos modelos contínuos nos ajustes. Mais precisamente,


exibiremos apenas um dos modelos apresentados por Assis,
Mendonça e Assis (2020).
Assim, por conveniência didática, abordaremos apenas
o modelo de crescimento exponencial (ou modelo contínuo de
Malthus) para ajustar os valores apresentados na Tabela 15.
Usaremos ajuste de curva com o recurso Regressão(<Lista de
Pontos>, <Função>) do GeoGebra.
Para o caso do número total de óbitos, na entrada
“Função” inserimos o modelo de Malthus

𝑦 = 𝛼𝑒 𝜆𝑥 (37)

em que os parâmetros 𝛼 e 𝜆 são positivos. Com o recurso do


controle deslizante, ajustamos 𝛼 = 1.13 e 𝜆 = ln(𝛼 ) ≈ 0.12
conforme dados apresentados pelos autores.
Tabela 15. Número total de casos (TC) e número total de óbitos (TO) por
COVID-19 no Brasil
Março Abril Maio
Dia TC TO TC TO TC TO
1 - - 6 836 240 91 589 6 329
2 - - 7 910 299 96 559 6 750
3 2 - 9 056 359 101 147 7 025
4 4 - 10 278 431 107 780 7 321
5 8 - 11 130 486 114 715 7 921
6 14 - 12 056 553 125 218 8 536
7 19 - 13 717 667 135 106 9 146
8 25 - 15 927 800 145 328 9 897
9 30 - 17 857 941 155 939 10 627

85
MT Ciência – Série Livros

10 34 - 19 638 1 056 162 699 11 123


11 52 - 20 727 1 124 168 331 11 519
12 76 - 22 169 1 223 178 214 12 461
13 98 - 23 430 1 328 188 974 13 149
14 121 - 25 262 1 532 202 918 13 993
15 200 - 28 320 1 736 218 223 14 817
16 234 - 30 425 1 924 233 142 15 633
17 291 1 33 682 2 141 241 080 16 118
18 428 4 36 599 2 347 254 220 16 792
19 621 7 38 654 2 462 271 628 17 971
20 964 11 40 581 2 575 291 579 18 859
21 1 178 18 43 079 2 741 310 087 20 047
22 1 546 25 45 757 2 906 332 382 21 116
23 1 891 34 49 492 3 313 347 398 22 013
24 2 201 46 52 995 3 670 363 211 22 666
25 2 433 57 58 509 4 016 374 898 23 473
26 2 915 77 61 888 4 205 391 222 24 512
27 3 417 92 66 501 4 543 411 821 25 598
28 3 904 114 71 886 5 017 438 238 26 754
29 4 256 136 78 162 5 466 465 166 27 878
30 4 579 159 85 380 5 901 498 440 28 834
31 5 717 201 - - 514 849 29 314
(Fonte: ASSIS; MENDONÇA; ASSIS, 2020, p. 100).

Assim, aplicando a ferramenta “Regressão(<Lista de


Pontos>, <Função>)” na respectiva lista e, posteriormente,
calculando o coeficiente de determinação 𝑅2 , obtemos

𝑦𝑇𝑂 = 216.9861𝑒 0.0544𝑥 e 𝑅2 = 0.989

86
MT Ciência – Série Livros

Na Figura 35 apresentamos o diagrama de dispersão do conjunto


de pontos, a curva de regressão e seu respectivo coeficiente de
determinação.

Figura 35. Total de óbitos por COVID-19 no Brasil de 17/03/2020 a


31/05/2020 e ajuste exponencial. (Fonte: Elaborado pelos autores).

Para o número total de casos (TC), também utilizamos


uma regressão de crescimento de Malthus (ou de crescimento
exponencial) com o recurso Regressão(<Lista de Pontos>,
<Função>), na entrada “Função” inserimos o modelo (37), cujos
parâmetros 𝛼 e 𝜆 são positivos. Com o recurso do controle
deslizante, ajustamos 𝛼 = 1.06 e 𝜆 = ln(𝛼 ) ≈ 0.058 conforme
dados apresentados pelos autores. Assim, aplicando a
ferramenta “Regressão(<Lista de Pontos>, <Função>)” na
respectiva lista e posteriormente calculando o coeficiente de
determinação 𝑅 2 , obtemos
87
MT Ciência – Série Livros

𝑦𝑇𝐶 = 2354.465𝑒 0.059𝑥 e 𝑅2 = 0.997

Na Figura 36 apresentamos o diagrama de dispersão do


conjunto de pontos, a curva de regressão e seu respectivo
coeficiente de determinação.

Figura 36. Total de casos (TC) por COVID-19 no Brasil de 17/03/2020 a


31/05/2020 e ajuste exponencial. (Fonte: Elaborado pelos autores).

Em ambos os casos, os ajustes de curvas indicam uma


tendência de crescimento do número de casos e do número de
óbitos, sem sinais de estabilização (ou platô), ou seja, no período
em que os dados foram coletados os modelos não apresentaram
comportamento assintótico.

88
MT Ciência – Série Livros

89
MT Ciência – Série Livros

MATERIAL CONSULTADO

ANTON, H.; RORRES, C. Álgebra linear com aplicações. 10. ed. Porto
Alegre: Bookman, 2012.

ASSIS, L. M. E; MENDONÇA, A. S.; ASSIS, R. A. Ajuste de curvas


utilizando dados do coronavírus COVID-19 e sistemas dinâmicos discretos.
Revista de Biomatemática IMECC – UNICAMP, v. 30, p. 93-110, dez.
2020.

BASSANEZI, R. C. Ensino-Aprendizagem com modelagem matemática:


uma nova estratégia. 4 ed. 2ª reimpressão. São Paulo: Editora Contexto, 2019.

BASSANEZI, R. C. Modelagem matemática: teoria e prática. São Paulo,


Contexto, 2015.

BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 7. ed. São Paulo:


Atual, 2011.

CASTANHEIRA, N. P.; MACEDO, L. R. D. Matemática financeira


aplicada. 3 ed. Curitiba, IBPEX, 2010.

CHAPRA, S. C; CANALE, R. P. Métodos numéricos para engenharia. 5.


ed. Porto Alegre, AMGH, 2011.

CRESPO, A. A. Estatística fácil. 19. ed. São Paulo: Saraiva, 2009.

DAL ZOT, W.; CASTRO, M. L. de. Matemática financeira. Porto Alegre,


Bookman, 2015.

DEKKING, F. M. et al. A Modern Introduction to Probability and


Statistics: Understanding Why and How. 1. ed. London: Springer-Verlag,
2005.

FERREIRA, R. S. Matemática aplicada às ciências agrárias: análise de


dados e modelos. Viçosa, Editora UFV, 1999.
90
MT Ciência – Série Livros

GROB, J. Linear regression. 1ª ed. Berlin Heidelberg: Springer-Verlag,


2003 (Lecture Notes in Statistics 175).

HOFFIMANN, R. Análise de regressão: uma introdução à econometria


[recurso eletrônico]. 5 ed. Piracicaba: O Autor, 2016.

HUET, S.; et al. Statistical Tools for Nonlinear Regression: A Practical


Guide With S-PLUS and R Examples, 2. ed. New York, Springer, 2004.
(Springer series in Statistics)

IEZZI, G.; HAZZAN, S.; DEGENSZAJN, D. Fundamentos de matemática


elementar, 11: matemática comercial, matemática financeira, estatística
descritiva. 9 ed. São Paulo, Atual, 2013.

IVANOV, A. V. Asymptotic Theory of Nonlinear Regression. 1. ed.


Amsterdam-Netherlands, Springer, 1997. v. 389. (Mathematics and Its
Applications).

MALAVAZI, M. C.; SHENG, L. Y. Fogão solar. In: ASSIS, L. M. E. de; et


al. (org). Projetos e modelagem matemática no ensino superior. Belém,
Editora RFB, 2020.

MATTEUCCI, M. B. A.; LOBATO, E. J. V. Comportamento do regime


térmico em Latossolo Vermelho escuro distrófico, em diferentes
profundidades na região de Goiânia, Centro-Oeste do Brasil. I solo sem
cobertura vegetal. In: CONGRESSO LATINO AMERICANO DE CIÊNCIA
DO SOLO, 23., 1996, Águas de Lindóia. Anais. Águas de Lindóia: SBCS,
1996.

MEC-INEP (BRASIL). Índice de desenvolvimento da educação básica


(IDEB): Resultados e metas. Disponível em < http://ideb.inep.gov.br/ >.
Acesso em: 15 jun. 2021.

MEYER, J. F. C. A.; CALDEIRA, A. D.; MALHEIROS, A. P. S.


Modelagem em educação matemática. 4. ed. Belo Horizonte, Autêntica
Editora, 2019.

ORLOFF, J.; BLOOM, J. Linear regression. Class 25, 18.05, Spring 2014.
MIT Open Course Ware. Disponível em:

91
MT Ciência – Série Livros

<https://ocw.aprende.org/courses/mathematics/18-05-introduction-to-
probability-and-statistics-spring-2014/readings/> acesso em: 23 jul. 2021.

RAWLINGS, J. O.; PANTULA, S. G.; DICKEY, D. A. Applied Regression


Analysis: a research tool. 2. ed. New York, Springer, 1998. (Springer texts
in Statistics).

RESNICK, R.; HALLIDAY, D.; KRANE, K. S. Física 1. 5. ed. Rio de


Janeiro: LTC, 2003.

SÃO PAULO. Dados estatísticos do estado de São Paulo. Secretaria de


Segurança Pública de São Paulo. Disponível em <
https://www.ssp.sp.gov.br/Estatistica/Pesquisa.aspx >. Acesso em: 13 jul.
2021.

SERAFIM, M. E. et al. Umidade do solo e doses de potássio na cultura da


soja. Revista Ciência Agronômica, Fortaleza, v. 43, n. 2, p. 222–227, jul.
2012. Disponível em:
<http://ccarevista.ufc.br/seer/index.php/ccarevista/article/view/1454>.
Acesso em: 09 jul. 2021.

SHAFER, D. S.; ZHANG, Z. Introductory statistics. LibreTexts, 2021.


Disponível em: < https://stats.libretexts.org/@go/page/653 >. Acesso em: 15
jun. 2021.

TIPLER, P. A.; MOSCA, G. Física para cientistas e engenheiros. 5. ed. Rio


de Janeiro: LTC, 2006.

VIELMA VIVAS, G. A.; GUERRA, D. R. S. Modelagem computacional do


trocador de calor solo-ar adaptado às condições climáticas de Belém.
Ambiente Construído, Porto Alegre, v. 21, n. 2, p. 359-381, abr./jun. 2021.
Disponível em: < https://doi.org/10.1590/s1678-86212021000200531>.
Acesso em: 21 jul. 2021.

WAKEFIELD, J. Bayesian and frequentist regression methods. New


York: Springer, 2013. (Springer Series in Statistics).

ZEVIANI, W. M.; RIBEIRO JR, P. J.; BONAT; P. J. Curso em modelos de


regressão não linear. Campina Grande, 2013. Disponível em:
<http://www.leg.ufpr.br/doku.php/pessoais:walmes:mrnl2013>. Acesso em:
09 jul. 2021.
92
MT Ciência – Série Livros

93
MT Ciência – Série Livros

Obras do Programa MT CIÊNCIA

Série Livros
1. Parasitologia Aplicada aos Animais de Produção
2. Espécies arbóreas da estação ecológica Rio Ronuro
3. Entre saberes e experiências: uma coletânea de práticas
pedagógicas de uma escola pública
4. Administração de medicamentos pela via parenteral
5. Vitrine tecnológica agrícola: culturais anuais na recuperação de
pastagens
6. Temas de importância na suinocultura e avicultura de Mato
Grosso “Swine and Poultry Day”
7. Ética na pesquisa com seres humanos: orientações e
procedimentos para aprovação de projetos
8. Ciências da Natureza e Matemática: relatos de ensino, pesquisa e
extensão. Volume 2
9. Anais do I Simpósio em Ciências Ambientais do Norte de Mato
Grosso (SICANM)
10. Um tratado + que galáctico sobre a bicicleta
11. Biodiversidade da Estação Ecológica do Rio Ronuro
12. Mamíferos do Parque Florestal do município de Sinop, Mato Grosso
13. Câncer de mama: conhecendo para prevenir, diagnosticar e tratar
14. Ética na pesquisa com seres humanos: orientações e
procedimentos para aprovação de projetos. (2ª Edição)
15. Insetos do Parque Florestal de Sinop, Mato Grosso
16. Câncer colorretal: o que devo saber?
17. Guia prático de metodologias ativas para o ensino superior
18. Modelos Matemáticos: análise de regressão com o GeoGebra

Série Acadêmica
1. Antiparasitários de uso em artrópodes
2. Moscas e mutucas de importância em Parasitologia Zootécnica
3. Mosquitos nematóceros importância em Parasitologia Zootécnica
4. Resistência à Antiparasitários
5. Uso básico do PowerPoint para montagem de apresentações
6. Gráficos, tabelas e operações básicas em bioestatística utilizando
o Excel
7. Cálculos farmacêuticos aplicados à Medicina Veterinária

94
MT Ciência – Série Livros

8. Protocolos para o isolamento e cultivo de bactérias do gênero


Bacillus
9. Simplificando a Química: Estequiometria
10. Simplificando a Química: Tabela periódica
11. Simplificando a microbiologia: Manual de aula prática
12. Validação de método analítico aplicado às ciências
farmacêuticas
13. Simplificando a imunologia: imunidade inata e adaptativa

Série Tecnologia
1. Introdução ao Manejo Integrado de Pragas
2. Introdução à Cosmetologia
3. Guia prático para criar Tenebrio molitor e seu uso como isca na
atividade de pesca esportiva
4. Formigas cortadeiras no Mato Grosso: Orientações técnicas para
o controle
5. Preparo de “semente inóculo” para o cultivo do cogumelo
comestível Shiitake

Série Pequenos Cientistas


Entomologia
1. Mosquitos
2. Entomologia em versos
3. Percevejos
4. Besouros (1ª Edição)
5. Besouros (2ª Edição)
6. Predadores

Mundo invisível
1. Coronavírus
2. Coronavirus (English)
3. Coronavirus (Español)
4. Coronavírus (Libras)
5. Koronavirus (Coronavírus em Macuxi – Língua Indígena)
6. Coronavírus (Waiwai – Língua Indígena)
7. Sybyryydin (Coronavírus em Wapichana – Língua Indígena)
8. Fungos
9. Bactérias
95
MT Ciência – Série Livros

10. Vacinas
11. Vaccines (English)
12. Protozoários e helmintos

Série Eu e o Outro
1. Trânsito

Série O Segredo dos Alimentos


1. Nutrientes
2. Obsesidade Infantil

Série Melhor Idade


1. Combatendo a Covid-19

Série Ciência Divertida


1. Tirinhas de Parasitologia: Haematobia irritans (mosca-dos-
chifres)
2. Tirinhas de Parasitologia: Carrapatos
3. Tirinhas de Parasitologia: O bicho-de-pé

96

Você também pode gostar