Você está na página 1de 186

04/08/22, 09:20 lddkls221_met_mat

MÉTODOS MATEMÁTICOS Imprimir

Ricardo Puziol de Oliveira

0
seõçatona reV
CONHECENDO A DISCIPLINA
Caro aluno, seja bem-vindo à disciplina de Métodos Matemáticos. Nesta disciplina,
trabalharemos com os tópicos mais importantes da álgebra, cálculo numérico e
probabilidade. Inicialmente, abordaremos a Álgebra Linear, com a estrutura
algébrica conhecida por matriz e suas principais propriedades. Uma vez definido o
que é uma matriz, introduziremos as operações com essa estrutura algébrica e o
conceito de determinantes. Para entender melhor, alguns exemplos práticos
relacionados à engenharia serão considerados.

Em segundo lugar, trabalharemos com os conceitos de cálculo numérico, tais


como: interpolação e integração numérica. Estes conceitos são ferramentas
fundamentais quando nos deparamos com problemas práticos, cuja solução não é
possível de se obter com métodos analíticos, gerando a necessidade do uso de
métodos numéricos. Encerraremos a disciplina com os conceitos fundamentais de
probabilidade e estatística, em que abordaremos as questões de hipóteses
estatísticas, regressão linear, organização de dados, medidas de tendência central
e de dispersão, entre outros conceitos importantes. Vale lembrar que essa
disciplina é uma das mais importantes na engenharia, pois ela permite, além da
álgebra, ênfases em cálculo numérico e estatística, que são fundamentais na
profissão de engenheiro, uma vez que esses conceitos formam a base matemática
da profissão.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/1
04/08/22, 09:21 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

MATRIZES

0
Ricardo Puziol de Oliveira

seõçatona reV
Fonte: Shutterstock.

CONVITE AO ESTUDO
Caro aluno, quando escutamos o termo “métodos matemáticos”, é natural que o
primeiro conceito que vem em nossa cabeça é a relação com a realização de
inúmeros cálculos, às vezes até sem-fim. Mas, será que estamos corretos sobre
esse conceito? 

Para iniciar seu entendimento sobre os conceitos abordados, trabalharemos com a


ideia de matrizes, as quais são, em linguagem popular, tabelas com um gama de
dados. As matrizes são objetos matemáticos úteis para organização e manipulação
de dados computacionalmente. Após essa ênfase no conceito de matrizes,
estudaremos outro conceito que é muito comum, especialmente em modelagem:
sistemas lineares. Os sistemas lineares podem ser aplicados em diversas situações,
por exemplo, no balanceamento de equações químicas, no cálculo de lucros e
dividendos de em empresa, nos problemas de otimização, na resistência de vigas,
entre muitas outras aplicações comuns em nosso cotidiano. 

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/13
04/08/22, 09:21 lddkls221_met_mat

Por fim, encerraremos a unidade com o conceito de autovalores e autovetores, os


quais, em geral, são utilizados em problemas de otimização computacional e em
aplicações voltadas para a área da física em contexto de mecânica.

0
Para exemplificar, suponha que você tem que lidar com um problema de
construção civil, cujo objetivo é avaliar a resistência das vigas. Para resolver essa

seõçatona reV
questão, você, inicialmente, trabalhará com a experimentação da situação e
coletará os dados dela. A partir disso, montará a matriz com os dados. Com a
matriz em mãos, por meio de sistemas lineares e operações com matrizes, você
poderá validar a sua hipótese sobre a resistência das vigas. Esta, porém, não é a
única situação em engenharia que você pode utilizar tais conceitos. Existem muitas
outras, como predição de níveis de poluição atmosférica, na engenharia ambiental;
concentração de solventes, na engenharia química; relatórios financeiros
empresariais, no setor público ou privado; entre muitas outras aplicações. Já se
imaginou trabalhando com as matrizes e os sistemas lineares sob essa visão? Para
lhe auxiliar, aprenderemos, no decorrer desta unidade, um pouco mais sobre
esses objetos. Mãos à obra! 

PRATICAR PARA APRENDER


Nesta seção, entenderemos o conceito de matrizes e determinantes por meio de
exemplos práticos e das definições dadas pela matemática em si. Com isso, você
compreenderá a importância do papel das matrizes quando se trata de dados
dispostos em tabelas e como realizar operações com esses dados.

Como exemplo dessa abordagem, podemos considerar uma experimentação de


resistência de vigas de uma construção civil, em que se obteve os valores das
componentes das forças para cada uma das realizações do experimento. Os dados
foram todos dispostos em tabelas, as quais, por sua vez, podem ser dispostas em
matrizes para realização de cálculos, a fim de se atingir o objetivo da pesquisa ou
do trabalho, que pode ser, por exemplo, o tempo total gasto para realização do
experimento ou a escala das forças consideradas nele. Portanto, o uso de
operações utilizando-se o conceito de matriz permite um melhor entendimento e
interpretações do experimento em questão.

Vamos criar uma situação hipotética para exemplificar o uso de matrizes no dia a
dia de trabalho, especialmente em áreas relacionadas à engenharia.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/13
04/08/22, 09:21 lddkls221_met_mat

Imagine que você foi convocado e nomeado para realizar uma verificação do
último relatório bimestral de uma empresa de construção civil no ano de 2020 em
relação às vendas de cimento e cal. Os dados de venda da empresa são descritos
pela matriz:

0
 1510   1960

seõçatona reV
V = [ ]
 1375   2015

Cada elemento  dessa matriz representa o número de unidades dos produtos do


tipo i (i = 1). A representação do cimento (i = 2) e a representação da cal vendidos
no mês j (j = 1) representam novembro, e j = 2 representa dezembro. De acordo
com as exigências, foi-lhe pedido para verificar as seguintes questões:

1.  Qual produto e em qual mês foi vendido menos sacos? Qual a maior diferença
de vendas entre os produtos nos meses correspondentes?

2.  Qual foi a arrecadação bruta da empresa no bimestre com esses dois tipos de
produtos, se o pacote de cimento custa R$30,00 e o pacote de cal custa R$50,00?
Qual foi a arrecadação bruta de cada mês?

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo. Iniciaremos com os conceitos fundamentais de matrizes, para que você
possa entender a relação delas com a disposição de dados em tabelas e como
realizar operações. 

CONCEITO-CHAVE
Ao estudar métodos matemáticos, deparamo-nos com diversos conceitos. Nesta
seção, abordaremos um conceito usual em muitas áreas do conhecimento, o
conceito de matrizes. As matrizes são essenciais para muitos problemas, não
apenas porque elas “ordenam e simplificam” mas também porque oferecem novos
métodos de resoluções e novos olhares sobre o problema.

Neste aspecto, entende-se por uma matriz uma tabela de elementos dispostos em
linhas e colunas. Por exemplo, ao coletarmos dados referentes às concentrações
de pH do rio Columbia no primeiro trimestre dos anos de 2013 a 2015, podemos
dispô-los na Tabela 1.1 a seguir.

Tabela 1.1 | Concentrações de pH do rio Columbia de acordo com a estação de monitoramento de água
Umatilla do estado de Washington, nos Estados Unidos, no período de 2013 a 2015

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/13
04/08/22, 09:21 lddkls221_met_mat

Mês Período

2013 2014 2015

0
Janeiro 8,12 7,97 8,01

seõçatona reV
Fevereiro 8,10 8,12 8,02

Março 8,18 8,08 8,10

Fonte: https://bit.ly/384JRCT. Acesso em: 20 jan. 2021.

Ao abstrairmos os significados das linhas e colunas, obtemos a seguinte matriz:


8,12   7,92   8,01
⎡ ⎤
8,10   8,12   8,02

⎣ ⎦
8,18   8,08   8,10

REFLITA

Quando temos uma tabela com uma enorme quantidade de linhas e


colunas, isto é, diversas variáveis, é viável a disposição desses dados em
forma de matriz?

Uma questão que você pode estar se perguntando é: quais são os elementos que
as matrizes podem incorporar? Na primeira impressão, pode parecer que as
matrizes incorporam apenas números, porém elas podem incorporar muitos
outros elementos, por exemplo, funções, matrizes, números complexos etc. De
fato, considere a matriz:
3
2 − 7i    3x
[ ]
2
x + 2    − i

Essa matriz contém em suas entradas números complexos e equações/funções


algébricas. Logo, uma matriz pode também conter uma combinação de elementos
de natureza diferente, não sendo exclusivamente formada por apenas números.

Outro fator importante quando se trabalha com matriz é a representação dela em


termos algébricos. Representamos uma matriz de m linhas e n colunas por:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/13
04/08/22, 09:21

A m×n =

⎢⎥

α
⎡ 11

termo [α

A =

B = [
   …   α 1n

 ⋮     ⋱    ⋮

α m1   ⋯  α mn



α m1   ⋯  α mn

ij ] mxn

8,01   8,10

8,12   8,02

7,12   7,97   8,01

8,10   8,12   8,02

= [α ij ]
m×n

ordem da matriz e o termo  representa a posição do elemento da matriz. Além


lddkls221_met_mat

Em que a letra maiúscula representa a matriz, o subscrito m x n representa a

disso, uma matriz é sempre escrita entre colchetes, parênteses ou duas barras. 

ASSIMILE

Sejam  dois números inteiros. Uma matriz A de ordem m × n é uma dupla


sequência de números reais distribuídos em m linhas e n colunas,
formando a seguinte estrutura:

A m×n =


α
⎡ 11
   …   α 1n

 ⋮     ⋱    ⋮

Cada entrada que compõe uma matriz chama-se de termo dessa matriz, e o
é dito termo geral dessa matriz.

Quando se fala de matriz, uma propriedade que merece destaque é a de igualdade


de matrizes. Diremos que duas matrizes são iguais se elas têm necessariamente o
mesmo número de linhas e colunas e seus termos correspondentes são todos
iguais.

EXEMPLIFICANDO

Considere as matrizes de concentrações de pH de dois rios aleatórios:


7,12   7,97

Note que, embora os números apresentados em ambas as matrizes sejam


iguais, as matrizes não são iguais, pois o número de linhas e colunas são
diferentes e os elementos na posição correspondente também são
diferentes.
0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/13
04/08/22, 09:21 lddkls221_met_mat

Uma segunda propriedade das matrizes é a operação de adição de matrizes. Por


exemplo, consideramos a Tabela 1.2 e a Tabela 1.3, as quais descrevem a produção
de materiais de construção em dois anos consecutivos em três regiões brasileiras.

0
Tabela 1.2 | Produção de materiais de construção (em milhões de toneladas) no primeiro ano

seõçatona reV
Cimento Tijolo Cal Madeira

Região Sul 3000 200 400 600

Região Norte 700 350 700 100

Região Central 1000 100 500 800

Fonte: elaborada pelo autor.

Tabela 1.3 | Produção de materiais de construção (em milhões de toneladas) no segundo ano

Cimento Tijolo Cal Madeira

Região Sul 5000 50 200 0

Região Norte 2000 100 300 300

Região Central 2000 100 600 600

Fonte: elaborada pelo autor.

Suponha que nosso interesse seja descrever uma tabela que nos dê a produção
por material de construção e por região nos dois anos conjuntamente. Como
procederemos? Ora, neste caso, partimos da operação conhecida como adição de
matrizes. Para realizá-la, devemos verificar se ambas as tabelas têm o mesmo
número de linhas e de colunas. No nosso exemplo, essa condição é satisfeita.
Logo, basta somar os elementos correspondentes e teremos a resposta para nosso
objetivo! Assim: 
3000   200   400   600 5000    50    200     0 8000   250    600     6
⎡ ⎤ ⎡ ⎤ ⎡
A + B =   700   350   700   100 + 2000   100   300   300 = 2700   450   1000    4

⎣ ⎦ ⎣ ⎦ ⎣
1000   100   500   800 2000   100   600   600 3000   200   1100   1

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/13
04/08/22, 09:21 lddkls221_met_mat

Portanto, a produção por material de construção e por região nos dois anos
conjuntamente é descrita pela Tabela 1.4.

Tabela 1.4 | Produção de materiais de construção (em milhões de toneladas) nos dois anos

0
Produção de materiais de construção (em milhões de toneladas) nos dois

seõçatona reV
anos

Cimento Tijolo Cal Madeira

Região Sul 8000 250 600 600

Região Norte 2700 450 1000 400

Região Central 3000 200 1100 1400

Fonte: elaborada pelo autor.

ASSIMILE

A soma de duas matrizes de mesma ordem A m×n = [a ij ]


m×n

B m×n = [b ij ]
m×n
é uma matriz de ordem m x n denotada por 
A + B = [a ij + b ij ]
m×n
, cujos elementos são obtidos da soma dos
elementos correspondentes entre as matrizes A e B.

Além da adição e da igualdade de matrizes, duas outras operações são comuns ao


estudarmos matrizes: a multiplicação de um escalar (número) por uma matriz e a
multiplicação de matrizes. Ambas as operações podem ser definidas formalmente
como: 

Definição: seja A m×n = [a ij ]


m×n
uma matriz de ordem m x n e k um número,
podemos definir a matriz k ⋅ A = [ka ij ]
m×n
, a qual define a operação de
multiplicação de uma matriz por um escalar.

Definição: sejam A m×n = [a ij ]


m×n
e B n×p = [b rs ]
n×p
, definimos a multiplicação
da matriz A pela matriz B como sendo a matriz AB = [c uv ] m×p , em que: 
c uv = ∑
n

k
a uk b kv = a u1 b 1p + ⋯ + a un b nv .

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/13
04/08/22, 09:21 lddkls221_met_mat

A primeira operação definida é relativamente simples, pois basta multiplicar o


número por cada elemento da matriz. Quanto à segunda operação, devemos
tomar um certo cuidado com ela. Por quê? Vamos ver algumas observações do
produto de matrizes:

0
•  Só podemos multiplicar duas matrizes A e B se o número de colunas de A for

seõçatona reV
igual ao número de linhas de B.

•  O elemento  é obtido multiplicando os elementos da i-ésima linha da primeira


matriz pelos elementos correspondentes da j-ésima coluna da segunda matriz e
somando-se esses produtos.

•  O produto AB das matrizes A e B geralmente é diferente do produto BA das


matrizes B e A. Além disso, em qualquer um dos casos, o produto pode não existir.

Para exemplificar essa operação, consideraremos a matriz A, que representa o


quadro com o número de engenheiros de uma construção civil, e B como uma
matriz que representa o número de projetos disponíveis em cada área da
empresa, em que:
2   1
⎡ ⎤
A = 4   2

⎣ ⎦
5   3

1   1
B = [ ]
0   4

Suponha que o interesse seja multiplicar ambos os quadros, a fim de monitorar os


recursos para a disposição dos projetos associados aos engenheiros. Neste caso,
queremos trabalhar com o produto da matriz A com a matriz B. Isto é,
2   1
⎡ ⎤
1   1
R = AB = 4   2 ⋅ [ ]
0   4
⎣ ⎦
5   3

Como o número de colunas da matriz A é igual ao número de linhas da matriz B,


podemos realizar o produto, e o resultado é uma matriz dada pelo número de
linhas de A com o número de colunas de B, isto é, a ordem da matriz resultante é .
Assim:
2   1 2  ⋅  1 + 1  ⋅  0   2  ⋅  1 + 1  ⋅  4 2    6
⎡ ⎤ ⎡ ⎤ ⎡ ⎤
1   -1
R = AB = 4   2 ⋅ [ ] = 4  ⋅  1 + 2  ⋅  0   4  ⋅  1 + 2  ⋅  4 = 4   12
0    4
⎣ ⎦ ⎣ ⎦ ⎣ ⎦
5   3 5  ⋅  1 + 3  ⋅  0   5  ⋅  1 + 3  ⋅  4  5   17

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/13
04/08/22, 09:21

R =

[
1    1

2    3

0    0

2
]

⎢⎥


4   12

5   17

]

Agora que sabemos algumas das operações básicas de matrizes, interessa-nos

3.  Matriz coluna: é o tipo de matriz formada apenas por uma coluna.

4.  Matriz linha: é aquela matriz que é formada por apenas uma linha.

[3   − 1    2]
lddkls221_met_mat

Portanto, a matriz que representa os recursos para a disposição dos projetos


associados aos engenheiros da empresa é dada por:
2    6

saber quais são os tipos de matrizes que podemos encontrar em nossas situações-
problema. Dos tipos conhecidos de matrizes, destacaremos dez deles:

1.  Matriz quadrada: é um tipo de matriz em que o número de linhas é igual ao


número de colunas.

2.  Matriz nula: é aquela matriz em que todos seus termos são nulos.
0    0

5.  Matriz diagonal: é aquela matriz quadrada, em que todos os elementos fora da


diagonal são nulos.


8    0    0

0    2    0

0    0    1

0    1

6.  Matriz identidade: é um tipo de matriz quadrada, em que todos os elementos


da diagonal são iguais a um, e os elementos fora da diagonal são iguais a zero.
1    0
]

7.  Matriz triangular superior: é aquela matriz quadrada, em que todos os


elementos abaixo da diagonal são nulos.
0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/13
04/08/22, 09:21

⎢⎥


8    2    1

0    0    1

3    5    1

-1   0   1

A =




0    2    3

8.  Matriz triangular inferior: é aquela matriz quadrada, em que todos os


elementos acima da diagonal são nulos.


8    0    0

1    2    0

9.  Matriz simétrica: é aquela matriz quadrada, em que se tem .


 8   5  -1

 5   2   0

5   7

4   4


;A
t

algumas situações do cotidiano.


= [
2   4   5

4   1   5
]
lddkls221_met_mat

10. Matriz transposta: é a matriz obtida da operação, em que, dada uma matriz A,


obtém-se uma matriz A’, tal que as linhas de A’ são as colunas de A.
2   2

Agora que conhecemos os tipos de matrizes e as operações básicas em relação às


matrizes, podemos definir o que é um determinante de uma matriz. Esse conceito
será útil nas seções posteriores na solução de sistemas lineares envolvendo

O que é determinante? Ora, quando nos referimos a esse termo, estamos nos
referindo a um número associado a uma matriz quadrada A. Esse número é
denotado como det(A) ou |A|. Mas, como encontra-se esse valor? Depende do
tamanho da nossa matriz. Nesta seção, trabalharemos com determinantes de
matrizes até a ordem . Vamos lá?

Para as matrizes de ordem 1x1, não temos nenhum cálculo associado ao


determinante, uma vez o que ele será o próprio elemento da matriz. No entanto,
para uma matriz de ordem 2x2, o cálculo do determinante é feito realizando o
produto dos elementos da diagonal principal subtraindo o produto dos elementos
da diagonal secundária. Em termos matemáticos, temos:

det [
a 11     a 12

a 21     a 22
] = a 11   ⋅  a 22 − a 12   ⋅  a 21
0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/13
04/08/22, 09:21

det

⎜⎢⎥⎟
Para as matrizes , o cálculo é feito da mesma maneira? Não necessariamente.

Procedemos, então, da mesma forma do determinante . Em termos matemáticos,


fazemos:

⎝⎣
a
⎛ ⎡ 11
    a 12     a 13

a 31     a 32     a 33
⎤⎞

a 21     a 22     a 23

⎦⎠
=
a
⎡ 11

Com isso, encerramos a nossa primeira seção sobre os conceitos básicos e


fundamentais de matrizes e determinantes, além das operações com esses
lddkls221_met_mat

Neste caso, utilizamos a regra de Sarrus para realizar o cálculo. Por esta regra,
adicionamos duas novas colunas na matriz inicial, repetindo os valores das duas
primeiras colunas. Agora temos três diagonais principais e três secundárias.

    a 12     a 13 a 11     a 12     


a 21     a 22     a 23

objetos. Tais conceitos serão de suma importância para orientar sua equipe no

trabalho proposto no início da unidade, especialmente para organização de dados.

FAÇA VALER A PENA


Questão 1
Suponha que uma certa indústria química fez uma análise de qualidade de água
em três anos consecutivos de quatro tratamentos indicados pelo órgão de
controle. Cada tratamento foi avaliado no potencial de remoção de um
determinado agente tóxico (em g/L) da água. Os dados obtidos sobre a
concentração removida em cada tratamento são expressos pela seguinte tabela:

Tratamento A

Tratamento B

Tratamento C

Tratamento D
2017

20

10

18

27

Fonte: elaborada pelo autor.


a 21     a 22     

a 31     a 32     a 33 a 31     a 32

= a 11   ⋅  a 22   ⋅  a 33 + a 12   ⋅  a 23   ⋅  a 31 +  a 13   ⋅  a 21   ⋅  a 32 −  a 11   ⋅  a 23   ⋅  a 32 −  a 12   ⋅  a 2

⋅ a 33 −  a 13   ⋅  a 22   ⋅  a 31

2018

55

47

38

15
2019

50

20

70

15
0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/13
04/08/22, 09:21 lddkls221_met_mat

Com base nos tópicos abordados na seção e na tabela apresentada, pode-se


afirmar que:

a.  O tratamento mais eficiente no ano de 2019 foi o tratamento A, uma vez que a maior concentração
removida é descrita pelo elemento  da matriz, que representa a tabela descrita no exercício.

0
b.  O tratamento mais eficiente no ano de 2018 foi o tratamento C, uma vez que a maior concentração

seõçatona reV
removida é descrita pelo elemento  da matriz, que representa a tabela descrita no exercício.

c.  O tratamento mais eficiente no ano de 2017 foi o tratamento B, uma vez que a maior concentração
removida é descrita pelo elemento  da matriz, que representa a tabela descrita no exercício.

d.  O tratamento mais eficiente no ano de 2018 foi o tratamento D, uma vez que a maior concentração
removida é descrita pelo elemento  da matriz, que representa a tabela descrita no exercício.

e.  O tratamento mais eficiente no ano de 2019 foi o tratamento C, uma vez que a maior concentração
removida é descrita pelo elemento  da matriz, que representa a tabela descrita no exercício.  

Questão 2
Após a conferência de um relatório financeiro de uma empresa, foi-lhe solicitado
um pedido de compra de material de construção civil. De acordo com seu chefe,
você deveria comprar: 40 toneladas do produto A, 50 toneladas do produto B e 60
toneladas do produto C. O custo dos produtos A, B, C é, por tonelada, R$ 5.000, R$
4.000 e R$ 2.500, respectivamente.

Usando multiplicações de matrizes, é correto afirmar que:

a.  O custo total da compra dos produtos é R$ 550.000.

b.  O custo total da compra dos produtos é R$ 750.000.

c.  O custo total da compra dos produtos é R$ 250.000.

d.  O custo total da compra dos produtos é R$ 350.000.

e.  O custo total da compra dos produtos é R$ 450.000.  

Questão 3
As aplicações de matrizes vão desde a física até a economia, ou até mesmo a
biologia. Partindo da natureza dessas aplicações, considere uma situação de
colisão entre dois carros. Assumindo um sistema de coordenadas cartesianas, as
posições desses carros são descritas pelos pontos A = (1,2) e B = (5, 1). Em termos
de física, para entender como ocorreu tal colisão, é necessário entender a
trajetória retilínea que passa pelos pontos A e B.

Com base nesse contexto, assinale a alternativa correta:


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/13
04/08/22, 09:21 lddkls221_met_mat

a.  A trajetória em questão é descrita pela equação 5x+4y-9=0.

b.  A trajetória em questão é descrita pela equação x-2y-1=0.

c.  A trajetória em questão é descrita pela equação x+4y-9=0.

0
d.  A trajetória em questão é descrita pela equação x-4y+15=0. 

seõçatona reV
e.  A trajetória em questão é descrita pela equação 15x+3y-9=0. 

REFERÊNCIAS
BORGES, R. S.; SOUZA, L. F. M.; CRUZ, P. G. G.; VANCONCELOS, B. S. Aplicação de
matrizes no cotidiano de um engenheiro. In: COLÓQUIO ESTADUAL DE PESQUISA
MULTIDISCIPLINAR, III, 2018, Mineiros. Anais [...]. Mineiros, GO: UNIFIMES, 2018.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 13/13
04/08/22, 09:22 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


MATRIZES

0
Ricardo Puziol de Oliveira

seõçatona reV
Fonte: Shutterstock.

SEM MEDO DE ERRAR


Nosso problema aqui é conferir as informações do relatório da empresa,
especificamente a matriz que representa as vendas. Para responder à primeira
questão, devemos, inicialmente, descrever o que cada linha e cada coluna
representa. Para esta empresa, as linhas são os produtos, e as colunas, os meses.
Assim, para saber qual produto teve o menor número de sacos vendidos, basta
olhar qual é a menor entrada da matriz. Neste caso, é o elemento , sobre o qual se
observa que foram vendidos 1.375 sacos de cal. Já para a segunda questão,

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/5
04/08/22, 09:22 lddkls221_met_mat

precisamos identificar a quais elementos a matriz se refere. O número de sacos de


cal vendidos em novembro, de acordo com a matriz, é o elemento , e o número de
sacos de cimento vendidos em dezembro é representado pelo elemento . Logo,
para saber quantos sacos de cal foram vendidos a mais que sacos de cimento,

0
deve-se fazer a seguinte operação:

seõçatona reV
D = a21 - a11 = 1375 − 1510 = −135

Dessa forma, em novembro, foram vendidos 135 sacos de cimento a mais que
sacos de cal nessa empresa. 

De modo análogo, para o mês de dezembro, temos que:

D = a21 - a12 = 2015 − 1960 = 75

Portanto, em dezembro, foram vendidos 75 sacos de cal a mais que sacos de


cimento nessa empresa. Logo, a maior diferença de vendas foi no mês de
novembro. 

Por fim, para a última questão, temos duas operações a se fazer. A primeira delas é
somar o número de sacos de cal e de cimento, individualmente. 

Cal = a21 - a22 = 1375 + 2015 = 3390

Cimento = a11 - a12 = 1510 + 1960 = 3470

A segunda operação é multiplicar os valores obtidos pelo valor unitário de cada


produto. Neste caso:

V Cal = R$ 50,00 x 3390 = R$ 169.500,00

V Cimento = R$ 30,00 x 3470 = R$ 104.100,00

Assim, a arrecadação do último bimestre de 2020 pela empresa foi um total de R$


273.600,00. Por outro lado, em relação à arrecadação total no bimestre, podemos
também trabalhar com o produto de matrizes definido, como:
 1510   1960
[30   50] ⋅ [ ]
 1375   2015

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/5
04/08/22, 09:22 lddkls221_met_mat

Em que a primeira matriz  representa os valores de cada produto, e a segunda


matriz 2x2 representa as vendas. Para obter o total arrecadado, basta realizar o
produto e somar as entradas, o que, nesse caso, é R$ 273.600,00. A vantagem
desse método é que a matriz resultante do produto traz a arrecadação bruta em

0
cada mês, e ela é dada por:

seõçatona reV
[114050    159500]

AVANÇANDO NA PRÁTICA

COLETA DE AMOSTRAS DE POLUENTES EM ÁREAS FLUVIAIS


Suponha que uma certa área fluvial, onde se realiza a pesca, que é a principal fonte
de renda uma determinada comunidade, foi contaminada por três tipos de
agentes tóxicos. A empresa responsável se propôs a pagar o dano causado por
meio de dois tipos de tratamentos de água. O número de béqueres e bolsas
plásticas para coletar cada amostra de cada poluente nessa área fluvial é descrito
na Tabela 1.5:

Tabela 1.5 | Número de béqueres e bolsas plásticas para cada amostra de cada poluente

Poluente A Poluente B Poluente C

Nº béqueres 13 18 20

Nº bolsas plásticas 2 3 4

Fonte: elaborada pelo autor.

Você, como engenheiro ambiental, foi chamado para realizar tal coleta no último
bimestre de 2020. Para analisar a eficácia do tratamento, você dispôs, na tabela a
seguir, o número de amostras de cada poluente necessárias a serem coletadas:

Tabela 1.6 | Número de amostras de cada poluente

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/5
04/08/22, 09:22 lddkls221_met_mat

Novembro Dezembro

Poluente A 12 6

0
Poluente B 24 12

seõçatona reV
Poluente C 12 9

Fonte: elaborada pelo autor.

Seu objetivo agora é determinar o número de béqueres e bolsas plásticas


necessários em cada um dos meses para a coleta das amostras. Para isto, é
necessário utilizar ambas as tabelas. Como você realizaria esse cálculo a partir das
informações dadas e utilizando os tópicos abordados nesta seção?

RESOLUÇÃO 

Nosso objetivo aqui é determinar o número de béqueres e bolsas plásticas


necessários em cada um dos meses para a coleta das amostras. Como faremos
isso? Primeiramente, transformamos ambas as tabelas em matrizes. Para nos
orientar, a primeira tabela será chamada de matriz-produtos, e a segunda,
matriz-coleta. Assim, por exemplo, para calcular o número de béqueres
necessários em novembro, multiplicamos cada elemento da 1ª linha da matriz-
produtos pelo elemento correspondente na 1ª coluna da matriz-coleta; em
seguida, somamos os três produtos, isto é, o número de béqueres necessários
em novembro é:

13 ⋅ 12  +  18 ⋅ 24  +  20 ⋅ 12  =  828

Do mesmo modo, para calcular o número de bolsas plásticas necessárias em


novembro, multiplicamos cada elemento da 2ª linha da matriz-produtos pelo
elemento correspondente na 1ª coluna da matriz-coleta; em seguida, somamos
os produtos obtidos. Assim, o número de bolsas plásticas necessárias para
novembro é:

2 ⋅ 12  +  3 ⋅ 24  +  4 ⋅ 12  =  144

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 4/5
04/08/22, 09:22 lddkls221_met_mat

Em outras palavras, estamos utilizando o conceito de multiplicação de matrizes


para atingir o nosso objetivo. Neste caso, é possível utilizar esse conceito, pois
as matrizes têm ordem  e , respectivamente. Assim, de maneira análoga ao que

0
foi feito para novembro, obtemos os valores do número de béqueres e bolsas

seõçatona reV
plásticas para dezembro, que são, respectivamente, 474 e 84. Portanto,
podemos dispor esses resultados em uma nova tabela (ou matriz), como
mostra a Tabela 1.7.

Tabela 1.7 | Quantidade total de produtos necessários para a coleta de amostras

Novembro Dezembro

Nº béqueres 828 474

Nº bolsas plásticas 144 84

Fonte: elaborada pelo autor.

Essa é a matriz que representa a quantidade total dos produtos necessários


para realizar a coleta das amostras de cada poluente na região fluvial
considerada.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 5/5
04/08/22, 09:22 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

SISTEMAS LINEARES

0
Ricardo Puziol de Oliveira

seõçatona reV
Fonte: Shutterstock.

PRATICAR PARA APRENDER


Caro aluno, nesta seção, entenderemos o conceito de sistemas lineares por meio
de exemplos práticos e de definições dadas pela matemática em si. Com isso, você
compreenderá a importância do papel dos sistemas lineares e como eles podem
ser utilizados em situações do dia a dia.

Como exemplo dessa abordagem, podemos considerar o balanceamento de


equações químicas, muito comuns em aplicações de engenharia química.
Balancear uma equação pode nos dizer muitas coisas sobre o comportamento de
uma molécula em determinada reação, e os sistemas lineares são fundamentais
para trabalharmos com esse conceito, por permitirem calcular com precisão a
quantidade de átomos necessários para que se tenha um equilíbrio químico na
reação.

Caro aluno, criaremos uma situação hipotética para exemplificar o uso de sistemas
lineares no dia a dia de trabalho, especialmente em áreas relacionadas à
engenharia.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/13
04/08/22, 09:22 lddkls221_met_mat

Em engenharia elétrica, uma das aplicações mais comuns de sistemas lineares é a


que envolve circuitos elétricos. Suponha que você tenha sido contratado para
identificar os valores da corrente elétrica em um circuito elétrico composto por
quatro ciclos fechados, no qual as correntes são denotadas como I1, I2, I3, I4, e as

0
direções atribuídas a cada uma dessas correntes são arbitrárias, isto é, se uma

seõçatona reV
corrente tem valor negativo para sua intensidade, então sua direção real é inversa
à direção estipulada na situação considerada. Lembrando-se de que o fluxo de
corrente num ciclo é governado pelas leis de Kirchhoff (a soma algébrica das
quedas de voltagem em torno do ciclo é igual à soma algébrica das fontes de
voltagem na mesma direção desse ciclo), foi obtido o seguinte sistema linear para
o problema:
p
Q = {  ;  p, q ∈ Z,  q ≠ 0}
q

No relatório que você deve escrever, há as seguintes perguntas: quais são os


valores das correntes elétricas nessa situação, de acordo com o sistema de
equações obtido? Quais são as direções dessas correntes? Para responder a essas
questões, sugere-se trabalhar com a forma linha-reduzida do sistema linear em
questão. Além disso, para entregar o relatório completo com suas observações, foi-
lhe solicitada a indicação dos campos: nome da empresa, problema, solução, custo
e assinatura.

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo. Iniciaremos com os conceitos fundamentais de sistemas lineares e suas
aplicações em engenharia química; em seguida, trabalharemos com métodos de
soluções desses sistemas, especialmente em forma de matrizes.

CONCEITO-CHAVE
Anteriormente, exploramos o conceito de matrizes e suas principais características.
Será que é somente esse tipo de estrutura que encontramos no nosso dia a dia?
Para responder a essa questão, consideraremos a situação em que você deseja,

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/13
04/08/22, 09:22 lddkls221_met_mat

por exemplo, saber quantas moléculas de hidrogênio (H2) e de oxigênio (O2) são
necessárias para formar a água (H2O). Podemos escrever essa relação como:

xH2 + yO2 → zH2O

0
Como encontramos os valores de x, y e z que satisfazem essa relação? Como os

seõçatona reV
átomos não são modificados, o número de cada elemento no início da reação deve
ser igual ao número de átomos no fim da reação. Assim, podemos escrever o
seguinte sistema de equações:
2x = 2z
{
2y = z

Se conseguir resolver o sistema apresentado, temos o número de moléculas


necessárias para satisfazer a reação e, assim, entender um pouco sobre reações
químicas na natureza. Essa estrutura aqui introduzida é chamada de sistema linear
de equações e será nosso objeto de estudo desta unidade.

ASSIMILE

Matematicamente, definimos um sistema linear com m equações e n


incógnitas como sendo um conjunto de equações do tipo:

⎧ a11x1 + a12x2 + … + a1nxn = b1

a21x1 + a22x2 + … + a2nxn = b2





am1x1 + am2x2 + … + amnxn = bm

Com aij e bi, 1 ≤ i ≤ m,  1 ≤ j ≤ n, números reais. Uma solução do


sistema acima é uma n-upla de números que satisfaça simultaneamente
todas as equações.

Os sistemas lineares são utilizados em muitas situações, por exemplo, tráfego de


veículos, balanceamento de equações químicas, funções polinomiais, ruído
acústico, sistemas GPS, mecanismos de busca (como o Google), entre muitas
outras. Nosso foco será, em especial, as aplicações voltadas para a engenharia.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/13
04/08/22, 09:22 lddkls221_met_mat

EXEMPLIFICANDO

Como primeiro exemplo, consideremos a combustão da gasolina. Embora a


gasolina seja uma mistura de hidrocarbonetos, o composto que predomina
é o C8H18. Em estudos de engenharia química, estabelece-se que a

0
combustão completa da gasolina acontece quando reage com o gás

seõçatona reV
oxigênio, que resulta em gás carbônico e água, isto é,

C8H18 + O2 → CO2 + H2O

A primeira questão que podemos descrever é: essa equação está


balanceada? Observando-se a reação, vê-se que não, então, para balanceá-
la, consideraremos a estrutura de sistemas lineares. Neste caso, podemos
reescrever a equação como:

xC8H18 + yO2 → wCO2 + zH2O

Assim, observa-se que:

•  A relação para os átomos de carbono é: 8x=w. 

•  A relação para os átomos de hidrogênio é: 18x=2z.

•  A relação para os átomos de oxigênio é: 2y=2w+z.

A partir dessas informações, podemos escrever o seguinte sistema linear:

⎧ 8x − w = 0

S :  ⎨ 18x − 2z = 0

2y − 2w − z = 0

E como resolvemos esse sistema? 

Para responder à questão do nosso exemplo, introduziremos um novo conceito:


matriz ampliada de um sistema linear. Considere o sistema linear em sua forma
geral:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/13
⎪⎢⎥
04/08/22, 09:22


8

am1

18

0
a11x1 + a12x2 + … + a1nxn = b1

a21x1 + a22x2 + … + a2nxn = b2

am1x1 + am2x2 + … + amnxn = bm

Em que A =  

2

−1

−2
a1n

amn


matriz das incógnitas e B =  

amn

a11

am1

0      −2      0

−1

Esse sistema pode ser reescrito em forma de matriz como:


a11 ⋯

bm


x1

xn


=

a1n

amn



b1

bn
b1

bn

entanto, essa não é a única forma matricial do sistema, podemos também


considerar a matriz:


a11

am1

… …
a1n

   …
b1




lddkls221_met_mat

é a matriz dos coeficientes, X

é a matriz dos termos independentes. No

Essa matriz é chamada de matriz ampliada do sistema. Nela, cada linha é apenas
uma representação abreviada da equação correspondente no sistema. Voltando
ao nosso exemplo, podemos reescrever o sistema da combustão de gasolina em
forma matricial como:
0

0

Qual é o próximo passo? Para prosseguir, necessitamos de um outro conceito, o


qual chamamos de operações elementares. Elas são operações que realizamos na
matriz ampliada do sistema, a fim de obter uma matriz equivalente, que nos trará
a solução, caso exista, do sistema. São três tipos de operações que podemos
considerar:
=  


x1

xn


éa

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/13
18


0 0
0 0      −2      0

9/4     −2      0


0

0
0

⎢⎥
04/08/22, 09:22

1.  Permuta da i-ésima e j-ésima linha (Li↔Lj).

2.  Multiplicação da i-ésima linha por um escalar não nulo k (Li→kLi).

3.  Substituição da i-ésima linha pela i-ésima linha somado k vezes a j-ésima


linha (Li→Li+kLj).

Voltando ao nosso exemplo, a primeira operação elementar que faremos é: 


L2 → −


8

9/4     −2      0


0

−2      −1      0


0 2
0

2
9

−1

−2

−2
L1 + L2

−1

−1
0
, isto é,

0
0



L2→ − 

L2↔L3


9

E qual é a próxima operação? Agora, permutaremos a  com a , isto é,


8 0 −1 0 0 8

0
L1+L2

Veja que agora nossa matriz equivalente tem um aspecto mais simples para
obtermos a solução do sistema. Assim, podemos retornar para as equações do
sistema, reescrevendo-o de acordo com a matriz equivalente. Portanto,

4
8x − w = 0

⎨2y − 2w − z = 0
⎩ 9

4
w − 2z = 0
0

Observe que temos três equações para quatro variáveis. Neste caso, dizemos que
o sistema é possível (visto que nenhuma linha é do tipo, por exemplo, 2 = 0) e


8

−1
lddkls221_met_mat

9/4

indeterminado, ou seja, admite infinitas soluções, já que temos uma variável livre.
Seja w essa variável livre, logo, temos que:
9
w − 2z = 0 → z =

2y − 2w − z = 0 → 2y = 2w +

8x − w = 0 → x =
1

8
9

w
w

8
w → y =
0

−2

25

16
−1

−2

w
0

0


0

−1
0

0

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/13
04/08/22, 09:22 lddkls221_met_mat

Assim, o conjunto solução do sistema é descrito por 


K = {(
1

8
w,
25

16
w,
9

8
w,  w),  w ∈ R} . Portanto, o nosso balanceamento da
equação de combustão de gasolina pode ser escrito como:

0
xC8H18 + yO2 → wCO2 + zH2O

seõçatona reV
1 25 9
wC8H18 + wO2 → wCO2 + wH2O 
8 16 8

Se considerarmos , obtemos que uma forma para a combustão de gasolina é dada


pela equação:
1 25 9
C8H18 + O2 → CO2 + H2O
8 16 8

Viu como é importante o conceito de sistemas lineares na prática? Embora


consideremos um exemplo relacionado à engenharia química, podemos usar a
metodologia para outras áreas também.

REFLITA

Em que outra situação do cotidiano você poderia utilizar sistemas lineares e


resolvê-los partindo da ideia de operações elementares?

No nosso exemplo, consideramos o conceito de possível e indeterminado em


relação à solução do sistema. No entanto, é somente esse conceito que temos em
relação a isso? A resposta é não! Um sistema linear pode ser classificado de três
formas:

1.  Possível e determinado (SPD): quando não há variáveis livres e todos os valores


das variáveis considerados podem ser encontrados (observação: a solução (0, 0, ...,
0) é chamada de solução trivial do sistema e será excluída dessa classificação).

2.  Possível e indeterminado (SPI): quando o número de equações é menor que o


número de variáveis, obtendo-se, assim, uma variável livre, a qual gerará infinitas
soluções para o sistema.

3.  Impossível (SI): quando não há variáveis livres e não é possível determinar uma
solução do sistema em questão.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/13
04/08/22, 09:22 lddkls221_met_mat

Neste aspecto, trabalhamos com um novo conceito, que é o de matriz linha-


reduzida à forma escada. Tal conceito pode ser definido como: 

Definição: uma matriz mxn é linha-reduzida à forma escada se:

0
•  O primeiro elemento não nulo de uma linha não nula é igual a 1.

seõçatona reV
•  Cada coluna que contém o primeiro elemento não nulo de alguma linha tem
todos os seus outros elementos iguais a zero.

•  Toda linha nula está sempre abaixo de todas as linhas não nulas.

•  Se as linhas 1, ..., r são linhas não nulas e se o primeiro elemento não nulo da
linha i está na coluna ki, então k1<k2<...kr.

Essa definição descreve o que chamamos de escalonamento de uma matriz. Em


sistemas lineares, tal escalonamento é útil para definir a solução do mesmo de
acordo com a classificação anterior. Um outro conceito que nos auxilia nisso é o
conceito de posto e nulidade da matriz reduzida (ou equivalente) do sistema. Tal
conceito pode ser definido como:

ASSIMILE

Dada uma matriz A de ordem mxn, seja uma matriz B de ordem mxn a
matriz-linha reduzida à forma escada linha equivalente a A. O posto de A,
denotado por p, é o número de linhas não nulas de B, e a nulidade de a é o
número n-p.

Assim, podemos reescrever a classificação dos sistemas lineares de acordo com o


tipo de solução da seguinte forma:

•  Possível e determinado (SPD): quando o posto da matriz ampliada é igual ao


posto da matriz dos coeficientes. Ele terá solução única se n=p.

•  Possível e indeterminado (SPI): quando o posto da matriz ampliada é igual ao


posto da matriz dos coeficientes. Ele terá infinitas soluções se p<n.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/13
04/08/22, 09:22 lddkls221_met_mat

•  Impossível (SI): quando o posto da matriz ampliada é diferente do posto da


matriz dos coeficientes.

Com isso, encerramos a primeira parte desta seção que lida com os sistemas

0
lineares. Agora, vamos à segunda parte, que é referente às matrizes inversas.

seõçatona reV
Para trabalhar com inversão de matrizes, lidaremos necessariamente com as
operações elementares e a forma matriz-linha reduzida à forma escada. Neste
aspecto, dizemos que uma matriz A é invertível se sua matriz-linha reduzida à
forma escada é a matriz identidade. Além disso, sendo A-1 a inversa de A, o
produto A . A-1 resulta na matriz identidade. Veremos como esse procedimento
funciona na prática. Como exemplo, considere a matriz A dada por:
2 1 0 0
⎡ ⎤

1 0 −1 1
A =
0 1 1 1

⎣ ⎦
−1 0 0 3

Para começar o processo de inversão da matriz A, colocamos a matriz identidade


junto à matriz A e aplicamos as operações elementares com as linhas, a fim de
reduzir a parte esquerda (que corresponde a A) à forma escada da linha reduzida.
Além disso, as operações devem ser feitas simultaneamente na parte direita. Isto
é,
2 1 0 0| 1 0 0 0
⎡ ⎤

1 0 −1 1| 0 1 0 0

0 1 1 1| 0 0 1 0

⎣ ⎦
−1 0 0 3| 0 0 0 1

A primeira operação elementar que faremos é trocar a primeira linha com a


segunda linha, isto é, L1↔L2:
1 0 −1 1| 0 1 0 0
⎡ ⎤
2 1 0 0| 1 0 0 0

0 1 1 1| 0 0 1 0

⎣ ⎦
−1 0 0 3| 0 0 0 1

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/13
⎢⎥
04/08/22, 09:22

A segunda operação que faremos é somar a quarta linha e a segunda linha, a


primeira linha multiplicada por -2, isto é, L

A
1

isto é, L


1

Portanto,

−1
0

=
−1

−1

−1

−1

−1


2

= L2 − L3

−5

1
−2|

4|

−3|

1|

0|

0|

0|

1|

−3

−5

−1
1|

−2|

1|

4|

1|

−2|

3|

4|

−5

6
3

1
−1
1

1
0

−1

−3

−4

−1
:

2
−3

−5

−1
1

−2

−2

−1

−2

−1

6
2

−4
0

−3

−4

−1

1
0

Em seguida, trocaremos o sinal da terceira linha, isto é, L


seguida, anularemos o que falta na terceira coluna, isto é,
1 0 0 −1

−2

−1

−1


0

1
0

−4

1

Como terceira operação, faremos a subtração da segunda linha da terceira linha,

1

Por fim, obtemos a identidade à esquerda e a inversa de A à direita, isto é,


1 0


lddkls221_met_mat

4 = L4 − 2L1;

3
L2 = L2 − 2L1

= (−1)L3 e, em
:

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/13
04/08/22, 09:22

Como exercício, você pode verificar se, de fato, a matriz encontrada é a matriz

inversa da matriz A por meio do produtoA

é a matriz identidade de ordem 4. Com isso, encerramos esta seção sobre sistemas
lineares e suas aplicações no cotidiano e o procedimento para inversão de
matrizes.

FAÇA VALER A PENA


Questão 1
Os sistemas lineares são uma ferramenta de suma importância quando se trata de
métodos matemáticos e suas aplicações nas diversas áreas do conhecimento. Uma
das aplicações populares dessa ferramenta é, por exemplo, em mecanismos de
busca. Suponha que um certo mecanismo de busca seja regido pelo sistema linear:

⎧ x + y + z = 1

⎨ x − y − z = 2

{
2x + y + z = 3

Com base nos conceitos aprendidos nesta seção, assinale a alternativa correta:

a.  O sistema é possível e determinado.

b.  O sistema é impossível. 

c.  O sistema é possível e indeterminado.

d.  O sistema é infinito.

e.  O sistema tem apenas a solução trivial.

Questão 2
Suponha que você tenha como objetivo estimar o número médio de veículos em
quatro cruzamentos, a fim de ter uma ideia para um possível controle de poluição
no futuro. Para tal objetivo, você foi até a região comercial de uma determinada
cidade e obteve o seguinte sistema que rege o número de veículos:
10 + 10 + 10 + 30t 10
−1
=

⎢⎥
lddkls221_met_mat


−5
3

1
−3

−5

−1
6
−3

−4

−1
2 −4
2

1


 , em que I4

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/13
04/08/22, 09:22 lddkls221_met_mat

10x + 10y + 10z + 30t = 10


{
10x + 10y − 10z + 20t =  0

Nestas condições, assinale a alternativa correta:

a.  A solução do sistema é (10, 20, 30, 40), isto é, o número médio de veículos em cada cruzamento é

0
determinado.

seõçatona reV
b. A solução do sistema é (x, 2x, 3x, 4x), isto é, o número médio de veículos em cada cruzamento é
indeterminado. 

c.  A solução do sistema é (15, 15, 15, 15), isto é, o número médio de veículos em cada cruzamento é
determinado. 

d.  A solução do sistema é (-2+5z-y,y,z,1-2z), isto é, o número médio de veículos em cada cruzamento é
indeterminado. 

e.  A solução do sistema é (30, 15, 35, 75), isto é, o número médio de veículos em cada cruzamento é
determinado. 

Questão 3
Em um determinado estudo de engenharia de alimentos, foram estudados três
tipos de alimentos a respeito das vitaminas A, B, e C contidas nesses alimentos.
Obteve-se a seguinte relação:

•  O alimento I teve cinco unidades de vitamina A, duas unidades de vitamina B e


duas unidades de vitamina C.

•  O alimento II teve três unidades de vitamina A, uma unidade de vitamina B e


quatro unidades de vitamina C.

•  O alimento III teve quatro unidades de vitamina A, três unidades de vitamina B e
1 uma unidade de vitamina C.

Sabendo que são necessárias 11 unidades de vitamina A, 9 de vitamina B e 20 de


vitamina C, assinale a alternativa correta:

⎧ 5x + 2y + 2z = 11

a. O sistema linear que corresponde à situação descrita é: ⎨ 3x + y + 4z = 9 .



4x + 3y + z = 20

⎧ 5x + 2y + 2z = 20

b.  O sistema linear que corresponde à situação descrita é: ⎨ 3x + y + 4z = 11 .



4x + 3y + z = 9

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/13
04/08/22, 09:22

c.  O sistema linear que corresponde à situação descrita é: ⎨ 2x + y + 3z = 11 .

d.  O sistema linear que corresponde à situação descrita é: ⎨

e.  O sistema linear que corresponde à situação descrita é: ⎨

REFERÊNCIAS
BONAT, W. H. Sistemas de Equações Lineares. Curitiba, PR: UFPR, [s.d.].
Disponível em: https://bit.ly/3gouSbs. Acesso em: 15 fev. 2021.

FERNANDES, D. B. Álgebra Linear. São Paulo: Pearson, 2014.

FERNANDES, L. F. D. Álgebra Linear. Curitiba: Intersaberes, 2017.

FRANCO, N. Álgebra Linear. São Paulo: Pearson , 2016.

RINCON, M.; FAMPA, M. Álgebra linear. Aula 13: método de eliminação de Gauss.
Rio de Janeiro, RJ: CEDERJ, [s.d.]. Disponível em: https://bit.ly/3835pjr. Acesso em: 4
abr. 2021.

lddkls221_met_mat

⎧5x + 3y + 4z = 20


2x + 4y + z = 9

⎧ 5x + 2y + 2z = 11


2x + y + 3z = 9

3x + y + 4z = 20

⎧ 5x + 3y + 4z = 11

2x + y + 3z = 9

2x + 4y + z = 20
.

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 13/13
04/08/22, 09:22 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


SISTEMAS LINEARES

0
Ricardo Puziol de Oliveira

seõçatona reV
Fonte: Shutterstock.

SEM MEDO DE ERRAR


Usando o conceito de forma linha-reduzida por meio de operações elementares,
obtém-se que o sistema pode ser reduzido ao sistema:

⎧ 2I1 − I2 + I3 − I4 = 4

5I1 + I2 + I4 = 5
S : ⎨
I2 + I4 = 0

−2I4 = 4

A solução é . Portanto, o valor da intensidade da primeira corrente é 1 amp; da


segunda, 2 amp; da terceira, 2 amp; da quarta, -2 amp. Além disso, em termos de
direção, as direções das correntes I1, I2, I3 são as mesmas do que foi estipulado no
problema, e da corrente I4 a direção é oposta. Por fim, resta escrever o relatório,
no qual, você deve seguir este modelo:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/4
04/08/22, 09:22 lddkls221_met_mat

Nome da empresa

XXXXX

Problema

0
Intensidade e direções das correntes elétricas em quatro ciclos fechados de um

seõçatona reV
circuito elétrico.

Solução

De acordo com o sistema linear apresentado, obteve-se que os valores das


corretes elétricas são: primeira corrente é 1 amp; da segunda, 2 amp; da terceira, 2
amp; da quarta, -2 amp. Além disso, em termos de direção, as direções das
correntes I1, I2, I3 são as mesmas do que foi estipulado no problema, e da corrente
I4 a direção é oposta.

Custo

XXXX

Assinatura

XXXX

AVANÇANDO NA PRÁTICA

TRÁFEGO DE VEÍCULOS E POLUIÇÃO EMITIDA


Suponha que você tenha sido contratado para averiguar a poluição emitida por
veículos em uma região central de uma determinada cidade, na qual dois
conjuntos de ruas de mão única se cruzam, de acordo com o diagrama da Figura
1.1.

Figura 1.1 | Diagrama de fluxo de veículos

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/4
04/08/22, 09:22 lddkls221_met_mat

Fonte: elaborada pelo autor.

0
Sabendo que o fluxo de veículos é descrito no diagrama, foi-lhe solicitado estipular

seõçatona reV
a quantidade de veículos em cada um dos quatro cruzamentos e organizar tal
informação em forma de relatório, para apresentá-la aos seus superiores,
assumindo, posteriormente, que o valor de .

RESOLUÇÃO 

Primeiro, deve-se notar que, em cada cruzamento, o número de veículos que


entra deve ser o mesmo do número de veículos que sai. Por exemplo, no
cruzamento A, o número de veículos que entra é x1+450, e o número de
veículos que sai é x2+610. De maneira semelhante, podemos fazer o mesmo
para os outros cruzamentos. Assim, obtemos o seguinte sistema:
⎧ x1 + 450 =  x2 + 610

x2 + 520 =  x3 + 480


S : ⎨
x3 + 390 =  x4 + 600

x4 + 640 =  x1 + 310

Isto é:
⎧ x1 −  x2 = 160

x2 −  x3 = −40
S : ⎨
x3 − x4 =  210

x4 −  x1 = −330

Assim, a matriz aumentada do sistema é descrita por:


1 −1 0 0 160
⎡ ⎤

0 1 −1 0 −40

0 0 1 −1 210

⎣ ⎦
−1 0 0 1 −330

Após a redução à forma escada, fica:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/4
04/08/22, 09:22

⎢⎥

XXXX
1

Problema
0

0
0

0
−1

−1

−1

0
330

170

210

0

Portanto, a solução geral do sistema é dada por: 


(330 + x4,  170 + x4,  210 + x4, x4)

Nome

XXXX

Empresa
lddkls221_met_mat

. Como foi solicitado, na apresentação em


forma de relatório, assumindo que , você pode escrever da seguinte forma:

Estimar o número de veículos em quatro cruzamentos, de acordo com o


diagrama apresentado, assumindo que o número médio de veículos entre os
cruzamentos C e D é de 100 veículos, isto é, .

Solução

De acordo com o método matemático empregado – sistemas lineares –,


obteve-se que o número médio de veículos entre o cruzamento A e B é 270,
entre o cruzamento B e C é 310 e entre o cruzamento D e A é 430.

Assinatura

XXXXX
0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 4/4
04/08/22, 09:23 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

AUTOVALORES E AUTOVETORES

0
Ricardo Puziol de Oliveira

seõçatona reV
Fonte: Shutterstock.

PRATICAR PARA APRENDER


Caro aluno, nesta seção, abordaremos o conceito de espaços vetoriais e
transformações lineares. Os espaços vetoriais são uma das estruturas algébricas
mais importantes da álgebra, cujas aplicações são encontradas em diversos
aspectos do nosso dia a dia, por exemplo, no espectro de cores, que nos permite
fazer mudanças de coordenadas desses espectros baseando-se no conceito dos
espaços vetoriais e das transformações lineares. E falando em transformações
lineares, esses tipos de operações são a base fundamental da álgebra linear,
podendo ser aplicada em engenharia da computação quando trabalhamos com
criptografia, por exemplo.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/12
04/08/22, 09:23 lddkls221_met_mat

Já os autovalores, os autovetores e a diagonização são outras ferramentas que


podem ser utilizadas em engenharia biomédica nas questões de crescimento
populacional e transformações, e na computação em mecanismos de busca, como
o Google. 

0
Criaremos uma situação hipotética para exemplificar o uso das transformações

seõçatona reV
lineares em situações do cotidiano.

Em um estudo envolvendo engenharia biomédica, um determinado pesquisador


trabalhou com espectro de cores, em particular, coordenadas em espectro de
cores. Em sua pesquisa, ele tinha por interesse mudar o sistema de cores, a fim de
ampliar o espectro visível na retina. Sabe-se que, em geral, o espectro de cores é
baseado em RGB (red-green-blue), porém esse pesquisador tinha interesse em
criar um novo sistema de cores para determinar o espectro de cores. Ele chamou
esse novo padrão de YGM (yellow-gray-magenta), que se baseia em mudanças de
coordenadas por meio da transformação linear T : R
2
→ R
2
definida por 
T ((x, y)) = (x, −y) . No entanto, ele tinha dúvidas em como verificar se a
transformação era, de fato, linear e lhe contratou para fazer tal verificação, pois, se
ela fosse linear, o sistema de cores dele faria sentido no espectro. Então,
baseando-se nos conceitos de transformação linear, como você verificaria se a
transformação é linear? O sistema criado pelo pesquisador fez sentido em relação
ao espectro de cores?

Conseguiu ver a importância desses conceitos? Que tal começarmos a trabalhar


com eles e entender melhor sob o ponto de vista matemático e prático? Não se
preocupe, vamos lhe acompanhar em todo o processo, e os conceitos serão
construídos de forma gradual.

CONCEITO-CHAVE
Nas seções anteriores, exploramos os conceitos de matrizes e sistemas lineares
munidos das suas principais aplicações. Nesta seção, trabalharemos o conceito de
uma das estruturas algébricas mais importantes da álgebra linear: o espaço
vetorial.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/12
04/08/22, 09:23 lddkls221_met_mat

Um espaço vetorial V (sobre um campo F) é um conjunto, cujos elementos são


chamados de vetores, de modo que se pode adicionar (e subtrair) vetores e
multiplicar um vetor por uma constante de F. Essas constantes são chamadas
escalares. Matematicamente, os axiomas que definem um espaço vetorial são:

0
•  V é um grupo Abeliano isto é, valem as propriedades:

seõçatona reV
  Lei comutativa: v  +  w  =  w  +  v.

  Lei associativa:  u  +   (v  +  w)  =   (u  +  v)  +  w.

  Elemento neutro: u  +  0  =  0  +  u  =  u.

  Elemento oposto: u  −  u  =  0.

•  V admite uma multiplicação escalar por elementos de F, isto é, valem as


propriedades:

−u  =   (−1)u .

  Distributiva: a (u  +  v)  =  au  +  av.

  Associativa: a (bu)  =   (ab)u. 

Por exemplo, R se torna um espaço vetorial (sobre R) para as operações 


n

(x 1 ,  ..., x n )  +   (y 1 ,  ..., y n )  =   (x 1   +  y 1 ,  ..., x n   +  y n ) e 


a (x 1 ,  ..., x n )  =   (ax 1 ,  ..., ax n ) para todos os a e x  em R. Um exemplo mais
i

sofisticado, porém mais complicado, seria o espaço C  [0,1] de todas as funções


contínuas de valor real definidas em [0,1] com as operações naturais 
(f   +  g) (x) = f   (x) + g  (x) e (af ) (x) =  af (x).

Dentre as aplicações de espaços vetoriais, uma que se faz interessante é a que


envolve a mudança de coordenadas nos espectros de cores em relação ao sistema
de cores RGB (red-green-blue). Por exemplo, em física, o modelo matemático que
se adequa à representação do espaço espectral de cores é necessariamente um
espaço vetorial de dimensão finita, em que o processo de reconstrução de cor
utiliza uma base de cores primárias, que seria a base do espaço vetorial, gerando o
modelo tricromático de Young-Helmholtz, baseado no padrão RGB. Mas, antes de
entrar no conceito de base e dimensão, definiremos o que chamamos de
subespaço vetorial.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/12
04/08/22, 09:23 lddkls221_met_mat

Popularmente, dizemos que um subconjunto W de um espaço vetorial V é


chamado de subespaço quando se torna um espaço vetorial com as operações
herdadas de V, ou seja, quando somas e múltiplos escalares de vetores em W
pertencem a W. Matematicamente, dizemos que W é um subespaço vetorial de V

0
quando W ⊂ V , tal que o ∈ W ; u + v ∈ W e au ∈ W .

seõçatona reV
Dentre os exemplos, faremos um destaque para o subespaço chamado de span,
isto é, se A é um conjunto de vetores em V, então o span(A) de A é o menor
subespaço de V que contém A. Ele pode ser construído tomando todas as
combinações lineares (ou seja, suponha que v 1, v 2 ,   … ,  v k ∈ V e 
c 1  ,  c 2 ,   … ,  c k ∈  R . Então ∑ k

i = 1
ci vi é a combinação linear de v 1, v 2 ,   … ,  v k

com pesos c 1  ,  c 2 ,   … ,  c k ) dos vetores em A. Neste caso, 


span (A)  =   (v 1 ,   … ,  v k ) é um subespaço de V. 

Uma vez definido o que é subespaço vetorial, podemos trabalhar com o conceito
de base e dimensão abordado no exemplo sobre espectro de cores descrito
anteriormente. Neste aspecto, dizemos que uma base é uma coleção de vetores B
de um espaço vetorial V quando cada vetor em V pode ser escrito de uma maneira
única como combinação linear de elementos de B. As bases são precisamente os
conjuntos máximos independentes de vetores. As bases também são
precisamente os conjuntos de abrangência mínima de vetores e, em particular,
cada conjunto de abrangência pode ser reduzido a uma base. Vale lembrar
também que todo espaço vetorial tem uma base.

Definimos o que é base, mas e o que é dimensão? Para definir esse conceito, tome
quaisquer duas bases de V que têm o mesmo “tamanho”. Esse “tamanho” é
chamado de dimensão de V, e denotamos por dim(V). 

EXEMPLIFICANDO

Por exemplo, dim (R n
)  =  n  e dim (C  [0,1])  = ∞. De fato, a base
elementar de R consiste nos n vetores e1=(1,0, ...,0), ..., ei=(0, ..., 0, 1, 0, ...,
n

0) , ..., en=(0, ..., 0, 1) onde  tem um 1 no i-ésima posição. Para exemplificar,


consideraremos o vetor (x, y) ∈ R e tomaremos a base  2

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/12
04/08/22, 09:23 lddkls221_met_mat

B = {(1,0), (0,1)} . Note que o vetor genérico dado pode ser escrito como 
(x, y) = x(1,0) + y(0,1) para quaisquer que sejam os valores de x e y.
Logo, dim(R 2
) = 2 , e o resulto é análogo para R 3
,...,R
n
.

0
Agora, já sabemos o que é um espaço vetorial e o que é uma base, que são

seõçatona reV
ferramentas de suma importância para definir a nossa próxima estrutura de
trabalho, as transformações lineares. E o que é uma transformação linear?
Considere V e W dois espaços vetoriais sobre um corpo F. Uma transformação
linear de V em W é uma função T :  V → W que satisfaz:

• T (v 1  +  v 2 )  =  T (v 1 )  +  T (v 2 ) .

• T (αv)  = α T (v).

Para todo  e todo escalar . Como primeiro exemplo, consideraremos V um espaço


vetorial qualquer, a transformação identidade, definida por I (v)  = v, que é uma
transformação linear de V em V. De fato:

• I (v 1  +  v 2 )  =  v 1   +  v 2   =  I (v 1 )  +  I (v 2 ) ;

• I (αv)  = αv  = α I (v).

EXEMPLIFICANDO

Um outro exemplo de transformação linear, dado que V é um espaço


vetorial qualquer, é a transformação nula, definida por 0 (α)  =  0. De fato:

• 0 (v 1 +  v 2 )  =  0  =  0  +  0  =  0 (v 1 )  +  0 (v 2 ) .

• 0 (αv)  =  0  = α0  = αT (v).

Quais são as propriedades de uma transformação linear? Para verificarmos isso,


sejam V e W espaços vetoriais sobre um corpo F. A transformação linear 
T :  V →  W satisfaz as seguintes propriedades:

• T (0)  =  0 (T transforma o vetor nulo de V no vetor nulo de W).

• T (−v)  =   − T (v), para todo v ∈ V .

• T (v 1  −  v 2 )  =  T (v 1 )  −  T (v 2 ) , para todo v 1, v2 ∈ V .

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/12
04/08/22, 09:23 lddkls221_met_mat

•  Se U é um subespaço de V, então a imagem de U por T é um subespaço de W. 

•  Sendo T :  V → W linear, então:


n n
T (∑ α i v i )  = ∑ α i T (v i )
i = 1 i = 1

0
Baseando-se nessas propriedades, podemos trabalhar com o conceito de base

seõçatona reV
também. Isto é, dados V e W dois espaços vetoriais sobre um corpo F e dada uma
base de V = { v 1 ,   … ,  v n } , sejam w 1,   … ,  w n elementos arbitrários de W.
Existe uma única transformação linear T :  V →  W , tal que 
T (v 1 ) =  w 1 ,   … ,  T (v n )  =  w n . De fato, dado v ∈ V , existe uma única n-upla 
(x 1 ,   … ,  x n ) tal que v  =  x 1 v1 + … + xn vn e T (v) =  x 1 w1 + … +  x n w n .
Assim, T é uma aplicação bem definida que associa cada vetor v em V a um vetor 
T (v) em W. Portanto, pela definição de T, é imediato que 
T (v 1 ) =  w 1 ,   … ,  T (v n ) = w n . Agora, precisamos verificar que, de fato, T é
linear. Para verificar que T é uma transformação linear, seja 
u = y1 v1 + … + yn vn um vetor de V e α um escalar qualquer, temos que:

αv  +  u  =   (αx 1 + y 1 )v 1 + … + (αx n + y n )v n

Então:

T (αv + u) =   (αx 1 + y 1 )w 1 + … + (αx n +  y n )w n

Por outro lado:


n n n
T (αv)  +  T (u)  = α ∑ xi wi + ∑ y i w i    = ∑ (αx i + y i )w i
i = 1 i = 1 i = 1

Logo, T (αv  +  u)  =  T (αv)  +  T (u), e T é uma transformação linear.

Quando trabalhamos com transformação linear, um outro conceito que se faz de


extrema importância é o conceito de núcleo de uma transformação linear. No que
tange a eleo, sejam V e W dois espaços vetoriais sobre um corpo F e T :  V → W

uma transformação linear. O núcleo de T é dado pelo seguinte subconjunto de V: 


Ker (T ) = {v ∈ V ∣ T (v)  =  0} . Para exemplificar, seja T :  R
2
→  R
3
uma
transformação linear definida por T (x, y)  =   (0, x  +  y,  0). Qual é o núcleo de
T? Neste caso, temos que o núcleo de T é dado por:

  (x, y) ∈ Ker (T ) ↔   (0, x  +  y,  0)  =   (0, 0, 0) ↔ x  =   − y

Isto é: Ker (t) = {(x,   − x) ∣ x ∈ R}.


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/12
04/08/22, 09:23 lddkls221_met_mat

O núcleo da transformação linear tem algumas propriedades importantes para


nosso trabalho. Dentre todas elas, destacamos:

• Ker (T ) é um subespaço vetorial de V.

0
• A transformação T é injetora se, e somente se, Ker (T )  =   {0}.

seõçatona reV
Definimos o núcleo e as condições para uma transformação ser injetora. Mas, e no
que diz respeito à imagem e à sobrejetividade? Ora, dados V e W dois espaços
vetoriais sobre um corpo F e T :  V → W uma transformação linear. A imagem de
T é dada pelo seguinte subconjunto de W: I m (T ) =   {w ∈ W ∣ T (v)  =  w} .
Para exemplificar esse conceito, seja T :  R
3
→  R
3
uma transformação linear
definida por T (x, y,  z)  =   (x,  2y,  0). Qual é a imagem da transformação T?
Neste caso, a imagem de T é dada por:

Im(T ) = {(x,2y,0) : x, y ∈ R} = {(x(1,0,0) + y(0,1,0) : x, y ∈ R} = {(1,0,0), (0,2,0

Uma vez definida a imagem de uma transformação, podemos definir o conceito de


sobrejetora, isto é, seja V e W dois espaços vetoriais sobre um corpo F e 
T :  V → W uma transformação linear. Dizemos que T é sobrejetora se a imagem
de T coincidir com W, ou seja, T (V )  =  W , isto é, T será sobrejetora se dado 
w ∈ W existir v ∈ V , tal que T (v)  =  w.

Agora, com o núcleo e a imagem de uma transformação linear definidos, podemos


definir o resultado fundamental da teoria de transformações lineares, que é o
Teorema do Núcleo e da Imagem. Esse teorema traduz a dimensão do espaço
vetorial.

ASSIMILE

Teorema do Núcleo e da Imagem: sejam V e W espaços vetoriais de


dimensão finita sobre um corpo F. Dada a transformação linear 
T :  V → W , então:

dim (V )  =  dim (Ker (T ))  +  dim (I m (T ))

Portanto, a soma das dimensões do Ker(T) e da Im(T) é igual à dimensão do


espaço vetorial V.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/12
04/08/22, 09:23 lddkls221_met_mat

Para exemplificar esse resultado, consideraremos a transformação linear 


T :  R
3
→ R dada por T (x,  y,  z)  =  x  +  y  −  z. A partir dessa
transformação, determinaremos uma base do Ker(T) e, a partir da dimensão do
Ker(T) e da dimensão de R , determinaremos a dimensão da Im(T). Começamos,
3

0
então, pelo núcleo. Dizemos que um elemento (x, y, z) de R pertence ao núcleo de 3

seõçatona reV
T se:

T (x,  y,  z) =  x  +  y  −  z  =  0 ⇒  x  =   − y  + z

Isto é, um elemento do núcleo de T é da forma 


(x, y, z) = (−y + z,  y,  z) = y (−1,1,0) + z (1,0,1) . Logo, 
B = {(−1,1,0),   (1,0,1)} é um conjunto de geradores de Ker(T) e LI, isto é, B é
uma base de Ker(T) e dim (Ker (T ))  =  2. Como a dim (R 3
) = 3 , pelo Teorema
do Núcleo e da Imagem, temos que:
3
dim (R )  =  dim (Ker (T ))  +  dim (I m (T ))

⇒ 3 = 2 + dim(I m (T )

⇒  dim (I m (T )) = 3 − 2 = 1 

Um outro conceito importante que diz respeito às transformações lineares é o


conceito de isomorfismo. Para definir tal conceito, sejam V e W espaços vetoriais
sobre um corpo F, suponha que T :  V → W é uma transformação linear.
Dizemos que T é um isomorfismo se T for bijetora (isto é, T deve ser injetora e
sobrejetora).

REFLITA

Considere a transformação linear T :  R


2
→ P 1 (R) definida por 
T (x, y)  =  x  +   (x  +  y)t . É um isomorfismo? Observação: P 1 (R) éo
espaço vetorial de todos os polinômios de grau 1 com coeficientes reais.

Para finalizar nosso estudo de transformações lineares, trabalharemos com a


matriz de uma transformação linear, porém, antes, precisamos definir algumas
coisas.

ASSIMILE

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/12
04/08/22, 09:23 lddkls221_met_mat

Sejam U e V espaços vetoriais de dimensão n e m, respectivamente, sobre 


R . Consideremos uma transformação linear F : U → V . Dadas as bases 
B  = {u 1 ,   … ,  u n } de U e C  =   {v 1,   … ,  v m } de V, cada um dos
vetores F (u está em V e, consequentemente, é

0
1 ),   … ,  F (u n )

combinação linear da base C, isto é:

seõçatona reV
F (u 1 ) =  α 11 v 1 +   … +  α m1 v m

F (u 2 ) =  α 12 v 1 +   … +  α m2 v m

F (u n ) =  α 1n v 1 +   … +  α mn v m

Ou simplesmente:
m
F (u j )  = ∑ α ij v j  
i = 1

A partir dessa definição, podemos escrever a matriz de ordem mxn da


transformação linear F como sendo:
α 11 … α 1n
⎡ ⎤

M  =
⋮ … ⋮

⎣ ⎦
α m1 … a mn

É chamada de matriz da transformação linear F em relação às bases B e C e é


denotada por (F ) B,C
.

Passaremos agora para o conteúdo final desta seção: autovalores, autovetores e


diagonalização de operadores lineares. Começamos definindo o que é um
autovetor e um autovalor. Neste aspecto, seja V um espaço vetorial sobre um
corpo F e T : V → V um operador linear. Dizemos que um vetor v ≠ 0 de V é um
autovetor de T se existe um escalar k tal que T(v)=kv. Neste caso, dizemos que k é
um autovalor de T associado a v. Para exemplificar esse conceito, considere a
transformação linear T :  R
3
→ R
3
definida T(x, y, z)=(x, y, 0) e note que (0, 0, 1) é
um autovetor de T com autovalor k=0, pois T(0, 0, 1)=(0, 0, 0). Mas, na prática, como
trabalhamos com esses conceitos? Para isso, partimos do que chamamos de
polinômio característico, que trabalha com a matriz de uma transformação linear.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/12
04/08/22, 09:23 lddkls221_met_mat

ASSIMILE

Seja V um espaço vetorial de dimensão n e T : V → V uma transformação


linear. Dizemos que p T (t) é um polinômio característico de T se for obtido
como p T (t) = det (A − kI ) , em que A é a matriz de T e I é a matriz

0
identidade de ordem . 

seõçatona reV
Por exemplo, considere uma transformação linear que tem como matriz em
relação à base canônica de R a seguinte matriz: 2

0 1
A = ( )
1 0

Com base na definição de polinômio característico, temos que ele é dado por:
−k 1
2
p T (t) = det ( ) = k − 1
1 −k

As raízes são 1, -1 nos números reais. As raízes dos polinômios característicos são
conhecidas como autovalores de T, que é uma outra definição desse conceito. Uma
vez que sabemos o que é autovalor e autovetor, podemos definir o que é
diagonalização de operações, que é a definição final desta seção. Vamos lá?

Seja V um espaço vetorial de dimensão finita. Um operador linear (ou


transformação linear) T : V → V é dito diagonalizável se existe uma base de V
formada por autovetores de T. Para exemplificar, consideraremos o operador 
T : R
2
→ R
2
definido por T(x, y)=(4x+4y, x+4y), que tem como autovetores (2, -1)
e (2, 1), os quais formam uma base de R . 2

Como exercício, você pode verificar se os autovetores encontrados formam, de


fato, uma base de R . E, para encerrar esta seção, deixamos uma reflexão: em
2

quais situações práticas do cotidiano podemos aplicar o conceito de autovalores e


autovetores e de diagonalização de operadores?

FAÇA VALER A PENA


Questão 1
As transformações lineares são ferramentas fundamentais da álgebra linear, sendo
uma de suas principais aplicações em criptografia. No entanto, é necessário
entender o que faz um operador ser classificado como linear que difere um pouco

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/12
04/08/22, 09:23 lddkls221_met_mat

de funções lineares do cálculo.

Com base na definição de transformação linear, assinale a alternativa correta:

a.  Dados V e W dois espaços vetoriais sobre um corpo F, uma transformação linear de V em W é uma
função T :  V → W que satisfaz: T (v   +  v )  =  T (v )  −  T (v ) e T (αv)  = α T (v) para todo 

0
1 2 1 2

v , v  , v ∈  V e todo escalar α ∈  F . 
1 2

seõçatona reV
b.  Dados V e W dois espaços vetoriais sobre um corpo F, uma transformação linear de V em W é uma
função T :  V → W que satisfaz: T (v   +  v )  =  T (v )  +  T (v ) e T (αv)  = −α T (v) para todo e
1 2 1 2

todo v , v  , v ∈  V escalar α ∈  F .
1 2

c.  Dados V e W dois espaços vetoriais sobre um corpo F, uma transformação linear de V em W é uma
função T :  V → W que satisfaz: T (v   +  v )  =  T (v )  +  T (v ) e T (αv)  = α T (v) para todo 
1 2 1 2

v , v  , v ∈  V e todo escalar α ∈  F .
1 2

d.  Dados V e W dois espaços vetoriais sobre um corpo F, uma transformação linear de V em W é uma
função T :  V → W que satisfaz: T (v   − v )  =  T (v )  −  T (v ) e T (αv)  = −α T (v) para todo 
1 2 1 2

v , v  , v ∈  V e todo escalar α ∈  F . 
1 2

e.  Dados V e W dois espaços vetoriais sobre um corpo F, uma transformação linear de V em W é uma
função T :  V → W que satisfaz: T (v   +  v )  =  T (v − v )  e T (αv)  = α T (v) = −αT (v) para
1 2 1 2

todo v , v  , v ∈  V e todo escalar α ∈  F .


1 2

Questão 2
Autovalores e autovetores são ferramentas que podemos utilizar amplamente em
diversas áreas. Por exemplo, suponha que você foi contratado para avaliar a
performance de algoritmos de busca, como o Google. Em suas análises, você se
deparou com a seguinte matriz de uma transformação linear:
2 −3 0
⎡ ⎤

A = −3 2 0

⎣ ⎦
1 −1 6

Sabendo que a performance do mecanismo está relacionada com os autovalores,


assinale a alternativa que contém os autovalores associados à matriz da
transformação linear em questão:

a. -1, 5, 5.

b. -1, 5, 6.

c. -1, 5, -1.

d. -1, -1, -1.

e. 1, -5, -6.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/12
04/08/22, 09:23 lddkls221_met_mat

Questão 3
Suponha que você foi contratado por uma empresa de engenharia mecânica para
avaliar motores de combustão de carros automáticos. O objetivo é determinar a
eficiência do motor, que é governada pelo autovetor v = (1,a) da matriz 

0
0 1
A = [ ] associado ao maior dos autovalores de A, que é uma matriz de uma
1 1

seõçatona reV
transformação T originada das análises desse motor de combustão.

Com base nos conteúdos estudados nesta seção, assinale a alternativa que contém
o valor de a:

a.  1−√ 4

b.  1+√ 4

c.  1+√ 5

d.  1−√ 5

e.  1+√ 3

REFERÊNCIAS
FERNANDES, D. B. Álgebra Linear. São Paulo: Pearson, 2014.

FERNANDES, L. F. D. Álgebra Linear. Curitiba, PR: Intersaberes,, 2017.

FRANCO, N. Álgebra Linear. São Paulo: Pearson, 2016.

FRIENDLY, M. Eigenvalues and Eigenvectors: Properties. [S.l.: s.n.], 2020.


Disponível em: https://bit.ly/3grdOSa. Acesso em: 8 mar. 2021.

R-PROJECT. The R Project for Statistical Computing. R-project, 2021. Disponível em:
https://www.r-project.org. Acesso em: 8 mar. 2021.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/12
04/08/22, 09:23 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


AUTOVALORES E AUTOVETORES

0
Ricardo Puziol de Oliveira

seõçatona reV
Fonte: Shutterstock.

SEM MEDO DE ERRAR


Por definição, dados V e W dois espaços vetoriais sobre um corpo F, uma
transformação linear de V em W é uma função T :  V → W que satisfaz:

• T (v 1  +  v2)  =  T (v1)  +  T (v2) .

• T (αv)  = α T (v).

Para todo v 1, v2 , v ∈  V e todo escalar α ∈  F . Assim, utilizando as informações


do nosso problema, seja v 1 = (x1, y1) e v 2 = (x2, y2) pertencentes a R e k ∈ R 2

um escalar. Temos que:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:23 lddkls221_met_mat

T (v1 + kv2) = T ((x1, y1) + k (x2, y2))

Isto é:

T (x1 + kx2, y1 + ky2) = (x1 + kx2,   − y1 − ky2) = (x1, −y1) + (kx2, −ky2)

0
= (x1, −y1) + k (x2, −y2) = T (x1, y1) + kT (x2, y2) = T (v1) + kT (v2)

seõçatona reV
Ou seja:

T (v1 + kv2) = T (v1) + kT (v2)

Portanto, T é uma transformação linear e traduz uma reflexão em torno do eixo x,


isto é, o sistema proposto pelo pesquisador faz sentido por T ser linear e é
baseado na reflexão em torno do eixo x.

AVANÇANDO NA PRÁTICA

MECANISMOS DE BUSCAS
Suponha que você tenha sido contratado por uma empresa de computação para
implementar um novo mecanismo de busca. Depois de muitas análises, você se
baseou no conceito de autovalor para aprimorar o sistema e definir seu
mecanismo de busca. Para tal, você associou uma transformação linear, em que a
sua matriz é dada por:
3 0 0
⎡ ⎤

A = 0 3 2

⎣ ⎦
0 −1 0

Para concluir o mecanismo, você precisa saber quais são os autovalores para,
futuramente, discutir as questões de diagonalização.

RESOLUÇÃO 

Considerando a definição de autovalores, podemos prosseguir com a ideia de


polinômio característico. Neste caso, podemos associá-lo fazendo 
det(A − kI ) = 0 , em que I é a matriz identidade de ordem 3. Assim, obtemos
que:
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:23

det

∣⎜⎟


A − kI

O que implica que:

²
(3 − k)(k −3k + 2) = 0


=
3 − k

0 −1
0

3 − k

−k
0

2 = 0
lddkls221_met_mat

Logo, as raízes do polinômio característico são 1, 2 e 3, que correspondem aos


autovalores da transformação linear associada ao mecanismo de busca.

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:23 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

ZERO DE FUNÇÕES

0
Ricardo Puziol de Oliveira

seõçatona reV
CONVITE AO ESTUDO
Caro aluno, o que vem à sua cabeça quando escuta o termo métodos numéricos?
Aproximações? Se sim, você está em uma linha de pensamento correta! O cálculo
numérico é um subtópico dos métodos matemáticos que envolvem aproximações
para zeros de funções, aproximações de cálculo de integrais que podem estar
relacionadas com a área de uma placa de metal, por exemplo.

Para iniciar o entendimento dessa ferramenta que se faz fundamental nos


métodos matemáticos, vamos trabalhar com a ideia de como encontrar o zero de
uma função usando o computador e os métodos de aproximação quando essa
função for de uma natureza mais complexa. Um dos métodos mais conhecidos
para isso é o famoso método de Newton-Rhapson, que estabelece critérios para
encontrar uma aproximação da raiz de uma equação. Partindo dessa ideia de
zeros de funções, em seguida, vamos trabalhar com o que chamamos de
polinômio interpolador, que é um método de aproximação, uma função utilizando
um polinômio de natureza simples, a fim de facilitar o entendimento do nosso
problema. 

Por fim, vamos estudar os métodos numéricos para aproximar o valor de uma
integral, que na prática é fundamental para o cálculo da área, especialmente
quando se trabalha com placas de metais em formatos diferentes de figuras
planas, por exemplo. Vamos ver cada um desses conceitos devagar no decorrer
desta unidade.

PRATICAR PARA APRENDER

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/13
04/08/22, 09:23 lddkls221_met_mat

Caro aluno! Nesta seção, vamos trabalhar inicialmente com os conceitos de


sistemas numéricos a fim de entender o que é um sistema numérico, como
operamos um sistema numérico e como o computador e a calculadora entende
esses sistemas numéricos. Em seguida, vamos entender o conceito de erro e quais

0
tipos de erros podemos cometer quando trabalhamos com aproximações

seõçatona reV
numéricas. Por fim, vamos trabalhar com os tipos de métodos numéricos que
temos para lidar com o problema de encontrar o zero (raíz) de uma função,
independente da forma dessa função. 

Como exemplo dessa abordagem, podemos considerar o problema de encontrar o


ponto que maximiza, por exemplo, a temperatura de operação de uma máquina
industrial para entender a resistência em casos de acidentes térmicos. Dado a
complexidade do problema, muitas vezes, não é possível obter uma solução
usando métodos analíticos, fazendo-se assim o uso de métodos numéricos
importantes.

Vamos criar uma situação hipotética para exemplificar o uso dos métodos
numéricos no dia a dia de trabalho, especialmente em áreas relacionadas com a
Engenharia.

Imagine que você foi convocado para implementar um método numérico para
resolver o problema de maximização de lucro de uma dada empresa de software
no ano de 2020. O método que a empresa definiu para a implementação no
software matemático Maple foi o método do ponto fixo descrito pelos passos:

Dado f (x)  =  0, tal que escrevemos φ(x)  =  x e seja x aproximação inicial e  0

ε  >  0 tolerância, tem-se que:

1. Se |f (x 0)|  <  ε faça c  =  x e pare. 0

2. k  =  1.

3. x k = φ(xk−1) .

4. Se |f (x k)|  <  ε ou |x k  −  xk−1|  <  ε faça c  =  x e pare. 1

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/13
04/08/22, 09:23 lddkls221_met_mat

5. x k−1  =  xk .

6. k  =  k  +  1 e volte ao passo 3.

Como você faria para implementar esse algoritmo computacionalmente de forma

0
que ele fosse útil para a empresa? Além disso, a partir dessa implementação,

seõçatona reV
calcule o valor do lucro máximo quando a função que determina o lucro é dada
por f (x) = e x−2
assumindo uma aproximação inicial de 0.1 e uma precisão de
1%.

Viu como os métodos numéricos são fundamentais? Que tal começar a entender
como funcionam agora? Você será acompanhado em todo o processo no decorrer
da seção! Vamos iniciar então com algo mais simples, mas que é base para todo o
resto dos métodos numéricos: os sistemas numéricos.

CONCEITO-CHAVE
Você já parou para pensar no que são métodos numéricos? Como utilizamos um
sistema numérico? Nesta unidade, nosso foco será trabalhar com métodos
numéricos e é importante destacar que, quando falamos de uma solução
numérica, não estamos falando de uma solução exata, e sim de uma solução
aproximada. E como estamos falando de aproximações, estamos falando
necessariamente de precisão numérica, que é sujeita a erros. Assim, vamos
começar nossos estudos definindo o que é um sistema de ponto flutuante.

Vamos iniciar com um conceito muito importante que é o conceito de sistema de


aritmética de ponto flutuante. Você tem ideia do que é esse conceito?
Basicamente, um sistema de aritmética de ponto flutuante, representado por 
F (β,  t,  emin,  emax) , é um subconjunto dos números reais, F   ⊂  R, tal que os
elementos têm a forma:

y  =   ± (
d1

β
1
+
d2

β
2
+
d3

β
3
+ … +
dt

β
t

e
= ±(. d1d2d3...dt)β
e
onde 
0  ≤  di < β,  i  =  1, 2, .  .  .  ,  t . Isto é, esse sistema se caracteriza por quatro
componentes: a base β (que pode ser binária, decimal, hexadecimal, etc.); a

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/13
04/08/22, 09:23 lddkls221_met_mat

precisão t (número de algarismos do que chamamos de mantissa, que são os


algarismos que aparecem depois do ponto); e a variação do expoente , tal que 
emin ≤  e  ≤  emax . 

0
ASSIMILE

seõçatona reV
Todo sistema computacional utiliza algum sistema de aritmética de ponto
flutuante para trabalhar com números em que os resultados, em geral, são
apresentados em base 10. Esses sistemas são conhecidos como sistemas
numéricos de base 10.

Agora, vamos entender como funciona esse sistema. Começamos com a mantissa,
ela deve ser fracionária nessa representação, isto é, deve ser menor do que 1 para
que possamos trabalhar com a unicidade para a representação para cada y ∈ F .
Mas como fazemos isso? Ora, devemos trabalhar com o que chamamos de
normalização. Essa normalização deve ser feita de forma que d 1 ≠ 0 para y ≠ 0
para garantir a representação do sistema de ponto flutuante.

Mas temos um problema quando fazemos essa normalização. Você deve estar se
perguntando qual e lhe digo que é a questão do zero. Mas como assim? Veja que a
normalização no sistema de ponto flutuante exige que d 1 ≠ 0 , para obter
unicidade na representação, mas infelizmente essa restrição torna impossível
representar o zero de modo a adicioná-lo ao sistema. Então, como podemos
representar o zero nesse sistema? Nesse caso, uma maneira natural de
representar o zero é com o menor expoente possível, usando: 0,1 × β emin

ASSIMILE

É importante notar que a escolha de uma representação para o zero como


sendo o menor expoente que simboliza a mantissa nula não é a melhor
forma, pois isso traz perdas de dígitos significativos em operações.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/13
04/08/22, 09:23 lddkls221_met_mat

Uma vez definido o que é um sistema de aritmética de ponto flutuante, resta saber
se é um conjunto finito. De acordo com a definição do sistema de ponto flutuante
(ANDRADE, 2012), podemos notar que a quantidade de números normalizados é
definida pela expressão:

0
t−1
2(β  −  1)β (emax − emin +  1)  +  1,

seõçatona reV
uma vez que existem dois caminhos para o sinal, isto é, β  −  1 escolhas para o
dígito d , β escolhas para os t  −  1 dígitos restantes da mantissa, 
1

emax − emin +  1 valores para expoente. 

Essa questão de o sistema de ponto flutuante ser finito deriva, principalmente, da


questão em que o computador e a calculadora trabalham com seus cálculos
utilizando uma quantidade finita de dígitos. Por exemplo, na calculadora normal
temos 8 dígitos, na científica 14, e assim por diante; porém nenhum dos dois
trabalha com uma quantidade infinita de dígitos. Nesse aspecto, o uso dos
métodos numéricos traz a necessidade de trabalharmos com o roll finito de
dígitos. 

Então, sabemos que precisamos trabalhar com uma quantidade finita de dígitos,
mas sabemos também que os números irracionais, por exemplo, têm quantidades
infinitas de dígitos. Como procedemos para descartar os dígitos a fim de deixar
esse número “finito”? Ora, existem duas maneiras de se fazer isso:
arredondamento simétrico ou truncamento. Mas antes de definir o que são
ambos, vamos ressaltar que tanto o computador quanto a calculadora trabalham
com representação numérica discreta, isto é, dado um número x ≠ 0 no sistema
de aritmética de ponto flutuante de base 10, então x é escrito como:
e
x  =   ± 0,a1a2...atat+1...an × 10 ,

onde a 1 ≠ 0 . Nesse caso, a mantissa são os dígitos a 1, … ,  an e  é o expoente.


Logo, podemos representar x com  dígitos de duas maneiras diferentes. Ou seja,
e
x  =   ± 0,a1a2...atat+1...an × 10 ,

e
x  =   ± (0,a1a2...at) + 0,000 … 0at+1...an) × 10 ,

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/13
04/08/22, 09:23 lddkls221_met_mat

e e−t
x  =   ± 0,a1a2...at × 10 + ±0,at+1...an × 10 ,

Ou ainda, 
e e−t
x  =  f   ×  10 + g ×  10

0
Em que

seõçatona reV
f   =   ± 0,a1a2 .  .  .  at,  0 < |f | < 1

g  =   ± 0,at+1 .  .  .  an,  0 ≤ |g| < 1

Com essas representações em mente, podemos, então, definir os tipos de


arredondamentos. Assim, no que se refere ao arredondamento simétrico, ele pode
ser definido como: se o primeiro dígito a ser desprezado é menor que cinco,
descartamos todos os dígitos restantes; porém, se esse dígito for maior do que 5,
então somamos 1 ao dígito que antecede esse dígito. Por exemplo, considere o
número 5.2131412... e suponha que queremos esse número com apenas três
casas decimais. Nesse caso, o dígito na quarta casa decimal é igual a 1, que é
menor do que 5, então descartamos todos os dígitos a partir da quarta casa
decimal e ficamos com o número 5.213. Agora, no que tange ao conceito de
arredondamento por truncamento, ele é definido como: após decidir até qual casa
decimal vamos utilizar, simplesmente descartamos o restante dos dígitos.

EXEMPLIFICANDO 

Para exemplificar, vamos utilizar: √2 ≈ 1.4142135623730950488. Vamos


considerar ambos os tipos de arredondamentos considerando cerca de 10
casas decimais. Logo, tem-se √2 ≈ 1.4142135623 por truncamento e 
√ 2 ≈ 1.4142135624 por arredondamento simétrico. 

Conseguiu perceber a diferença entre os arredondamentos? Veja que, em ambos


os casos, obtemos um resultado diferente do valor original, uma vez que
descartamos casas decimais. Essa diferença é o que chamamos de erro, e é

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/13
04/08/22, 09:23 lddkls221_met_mat

importante conhecermos a magnitude desses erros. Assim, vamos trabalhar com


dois tipos de erros: o absoluto e o relativo. Suponha que x̄ seja uma aproximação
para x. O erro absoluto é definido por:

0
EAx = |x − x|
¯ e o erro relativo por:

seõçatona reV
|x−x|
¯
ERx = ,  x ≠ 0.
|x|

Em geral, o valor exato de  não é sempre conhecido. Nesse caso, o cálculo do erro
relativo não seria possível, no entanto, podemos utilizar a seguinte expressão do
erro relativo quando o valor exato não é conhecido:
¯
|x−x|
¯
ERx = ,  x ≠ 0.
|x|
¯

EXEMPLIFICANDO

Vamos considerar um exemplo em que x  =  1234.9 é uma aproximação


para x, tal que o erro absoluto seja menor do que 0.1. Assim, podemos
dizer que o valor exato x está no intervalo (1234.8, 1235.0). Por outro
lado, suponha que y  =  7.2 seja uma aproximação para y, tal que o erro
absoluto seja menor do que 0.1, então y pertence ao intervalo (7.1,7.3).
Será que a interpretação desses erros é igual tanto para x quanto para y?
Considerando o erro absoluto, observe que os majorantes são
necessariamente iguais, sendo assim o erro absoluto por si só não é
suficiente para diferenciar as interpretações dos erros de x e y, pois geram
a mesma interpretação. Então trabalhamos com o erro relativo. Note que:
EAx 0.1 −4
ERx = < ≈ 0.81 × 10
¯
|x| 1234.9

e
EAy 0.1 −1
ERy = < ≈ 0.14 × 10
|y |
¯ 7.2

Nesse caso, os erros relativos são diferentes. E essa diferença traz o


impacto na precisão da estimativa. No caso do x, vemos que a precisão da
estimativa dele é maior que a de y, visto que o erro relativo para x é muito
menor que o erro relativo para y.
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/13
04/08/22, 09:23 lddkls221_met_mat

Com base no exemplo anterior, percebemos que a confiança na nossa estimativa é


fundamental ao se utilizar métodos numéricos. Uma maneira de fazer isso é
usando o conceito de dígitos significativos. Para isso, vamos considerar a situação
do cálculo da hipotenusa de um triângulo retângulo. Suponha que um triângulo

0
retângulo tenha hipotenusa medindo √20 cm. Se utilizarmos um instrumento de

seõçatona reV
medida, como uma régua, vemos a medida ficar entre 4,47 e 4,48.

REFLITA

E se você quisesse uma precisão maior adicionando uma nova casa


decimal, poderíamos incluir qual dígito: 4,471 ou 4,476? Seria possível
incluir o dígito 4,479?

Para responder essa questão, podemos trabalhar com a relação entre os conceitos
de erro relativo e de dígitos significativos por meio da seguinte proposição: se o
erro relativo do valor aproximado de um número não excede 0.5 × 10 , então −n

esse valor tem n dígitos significativos (ANDRADE, 2012). Assim, dizemos que x̄
aproxima  com x dígitos significativos se d é o maior inteiro positivo, tal que:
¯
|x−x| 1 −d
< × 10
¯
|x| 2

Portanto, para encerrar a primeira parte do nosso conteúdo da seção, iremos


finalizar com os conceitos de estabilidade numérica. Em poucas palavras, podemos
definir a estabilidade numérica como sendo uma propriedade do algoritmo, uma
vez que algoritmos podem ser bem sensíveis conforme a variação de dados,
independentemente do método numérico utilizado. Isto é, de acordo com os
dados que temos, um algoritmo pode se tornar instável. E são esses conceitos que
nos dão a ideia da segunda parte do nosso conteúdo!

Suponha agora que estamos interessados em encontrar, numericamente, uma


solução aproximada para a equação f (x) = 0, onde f é uma função qualquer.
Nesta seção, vamos apresentar os métodos mais comumente utilizados, entre eles
o método da bissecção, o método do ponto fixo e o método de Newton-Rhapson.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/13
04/08/22, 09:23 lddkls221_met_mat

Vamos iniciar com o método da bissecção. O passo inicial desse método é


encontrar dois pontos, x e y, tais que f (x) ≥ 0 e f (y) ≤ 0. Se f(x) = 0 ou f(y) = 0,
nós paramos o método. Se f(x) = 0, então x é a raiz da equação, e o mesmo vale
para y quando f(y) = 0. Estamos interessados no caso fora dessas situações. Assim,

0
vamos considerar f : [a,  b]  →  R contínua, tal que f (a)f (b)  <  0. Seja m o

seõçatona reV
ponto médio de [a,  b]. Observe que se f (a)f (m)  <  0, então, pelo teorema do
valor intermediário, temos uma raiz no intervalo [a, m]. Por outro lado, se 
f (a)f (m)  >  0 , então temos que 
f (a)f (m)f (a)f (b)  =  [f (a)] f (m)f (b)  <  0
2
, pois [f (a)]²  > 0. Assim, segue
que f (m)f (b)  <  0 e, portanto, a raiz está localizada no intervalo [m,  b]. Dessa
forma, chamando a 0 = a e b 0 = b e aplicando-se diversas vezes a bissecção,
teremos os intervalos [a k,  bk] e pontos médios m . Logo, segue que: k

b−a
|bk − ak| = bk − ak = k
2

Ou seja, o método da bissecção trabalha com uma sequência convergente com


base em intervalos encaixados. Esse método em particular é extremamente lento,
mas a convergência é garantida se f for uma função contínua.

Certo, vimos uma maneira de resolver f (x) = 0. Vamos agora trabalhar sob outro
enfoque, o método do ponto fixo. Como trabalhamos com esse método? Ora,
inicialmente, dizemos que c é um ponto fixo para f se f (c)  =  c. Agora, seja 
f (x)  =  0 tal que escrevemos φ(x)  =  x e seja x aproximação inicial e ε  >  0 0

para o erro aceitável (ou tolerância para o erro admitindo o método), seguimos os
passos (ANDRADE, 2012):

1. Se |f (x 0)|  <  ε faça c  =  x e pare. 0

2. k  =  1.

3. x k  =  φ(xk−1) .

4. Se |f (x k)|  <  ε ou |x k  −  xk−1|  <  ε faça e pare.

5. x k−1  =  xk .

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/13
04/08/22, 09:23 lddkls221_met_mat

6. k  =  k  +  1 e volte ao passo 3.

Com isso, encerramos a nossa primeira seção sobre os conceitos básicos e


fundamentais de sistemas numéricos, além dos métodos para encontrar zero de

0
funções! Tais conceitos serão de suma importância para orientar sua equipe no
trabalho e também para resolver problemas relativos à modelagem que envolva

seõçatona reV
métodos numéricos.

FAÇA VALER A PENA


Questão 1
Quando se trabalha com aproximações numéricas, estamos sujeitos a erros. Erros,
por sua vez, podem até mesmo invalidar o procedimento numérico dependendo
de sua magnitude. Em métodos numéricos, temos dois tipos de erros: o absoluto e
o relativo.

Com base nos conceitos desses erros, assinale a alternativa correta.

a.  O erro absoluto é a diferença entre o valor exato de um número e seu valor aproximado. Já o erro relativo
é a razão entre o erro absoluto e o valor aproximado.

b.  O erro absoluto é a soma entre o valor exato de um número e seu valor aproximado. Já o erro relativo é a
razão entre o erro absoluto e o valor aproximado.

c.  O erro absoluto é a soma entre o valor exato de um número e seu valor aproximado. Já o erro relativo é a
diferença entre o erro absoluto e o valor exato.

d.  O erro absoluto é a soma entre o valor exato de um número e seu valor aproximado. Já o erro relativo é a
razão entre o erro absoluto e o valor exato.

e.  O erro absoluto é a soma entre o valor exato de um número e seu valor aproximado. Já o erro relativo é a
diferença entre o erro absoluto e o valor aproximado.

Questão 2
O método de Newton-Rhapson é um dos métodos numéricos mais populares em
muitas aplicações. Ele pode ser utilizado para muitas coisas, dentre elas, o cálculo
aproximado de raízes quadradas. Para isso, toma-se uma função auxiliar 
f (x) = x
2
− N em que N é o número que desejamos calcular a raiz quadrada.

Com base nessa ideia, assinale a alternativa que contém o valor aproximado da
i d d d 7 l é d d N Rh
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/13
04/08/22, 09:23 lddkls221_met_mat

raiz quadrada de 7 pelo método de Newton-Rhapson.

a. 2,645752048.

b. 2,744521548.

0
c. 3,211654899.

seõçatona reV
d. 2,541545832.

e. 2,610414105. 

Questão 3
Suponha que você foi contratado por uma empresa de engenharia de software
para implementar métodos numéricos computacionalmente. O método escolhido
foi o da bissecção. Seu supervisor ficou com dúvidas em duas linhas que faltam
preencher e foi solicitar sua ajuda. A implementação que deve ser completada é
descrita pelo código a seguir e as linhas que faltam estão em lacunas:

metodobissec:=proc(f::procedure,epsilon::positive,a0::numeric,b0::numeric) local
err,m, a, b, A, B, n;

A:='A': B:='B':

err:=1.: a[0]:=a0: b[0]:=b0: m[0]:=(a[0]+b[0])/2:

for n from 0 while err>=epsilon do

____________________

err:=evalf(abs(a[n]-b[n]));

____________________

a[n+1]:=a[n];

b[n+1]:=m[n]

else

a[n+1]:=m[n];

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/13
04/08/22, 09:23 lddkls221_met_mat

b[n+1]:=b[n]

fi:

printf("x[%d] = %10.6e | erro = %10.6e\n",n,m[n],err);

0
od:

seõçatona reV
end:

Com base no método da bissecção, assinale o que for correto.

a. As linhas de código que faltam para completar a implementação são, respectivamente, dadas por:
m[n]:=evalf((a[n]+b[n])/4): e if evalf(f(a[n])*f(m[n]))<=0 then. 

b. As linhas de código que faltam para completar a implementação são, respectivamente, dadas por:
m[n]:=evalf((a[n]+b[n])/3): e if evalf(f(a[n])*f(m[n]))>=0 then.

c. As linhas de código que faltam para completar a implementação são, respectivamente, dadas por:
m[n]:=evalf((m[n]+b[n])/3): e if evalf(f(a[n])*f(m[n]))<=0 then.

d. As linhas de código que faltam para completar a implementação são, respectivamente, dadas por:
m[n]:=evalf((a[n]+m[n])/2): e if evalf(f(b[n])*f(a[n]))>=0 then.

e.  As linhas de código que faltam para completar a implementação são, respectivamente, dadas por:
m[n]:=evalf((a[n]+b[n])/2): e if evalf(f(a[n])*f(m[n]))<=0 then.  

REFERÊNCIAS
ANDRADE, D. Cálculo Numérico. In: NOTAS de aula. [S. l.], 2012.

FERNANDES, D. B. Cálculo Numérico. São Paulo: Editora Pearson, 2015

FRANCO, N. B. Cálculo Numérico. São Paulo: Editora Pearson, 2006.

GIUSTINA, E. D.; AVELAR, S. F. Aplicação do método de Newton-Rhapson para


resolver problema de despacho econômico envolvendo geração térmica de energia
elétrica. In: IX SEEMI - Seminário Estadual de Engenharia Mecânica e Industrial.
Anais do XV CONEMI - Congresso Nacional de Engenharia Mecânica e
Industrial. Novo Hamburgo, 2015. Disponível em:
http://www.feevale.br/Comum/midias/b5eae6f1-6386-4c4c-9eb5-
01418ad7e47b/EDGAR%20DELLA%20GIUSTINA%20-1.pdf. Acesso em: 23 jun. 2021.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/13
04/08/22, 09:23 lddkls221_met_mat

UFRGS. Método de Newton-Raphson. UFRGS - IME - Recursos Educacionais


Abertos de Matemática. 2020. Disponível em:
https://www.ufrgs.br/reamat/CalculoNumerico/livro-sci/sdeduv-
metodo_de_newton-raphson.html. Acesso em: 26 mar. 2021. 

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 13/13
04/08/22, 09:24 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


ZERO DE FUNÇÕES

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Nosso problema aqui é implementar o método do ponto fixo utilizando o software
Maple. Note que uma implementação computacional pode ser feita de várias
formas diferentes e ainda assim gerar o mesmo resultado. O que vai mudar entre
uma e outra é somente a eficiência e visualização do algoritmo. Então, como
sugestão dessa implementação, podemos fazer:

metodoptofixo:=proc(g::procedure, x0, epsilon) local x, ErrAbs, tol, ErrRel, k;

x[0]:=x0;

ErrAbs:=1;

tol:=0;

for k from 0 while ErrAbs>=tol do

x[k+1]:=evalf(g(x[k]));

ErrAbs:=evalf(abs(x[k+1]-x[k]));

ErrRel:=evalf(ErrAbs/abs(x[k+1])):

tol:=evalf(epsilon*abs(x[k+1]));

printf("x[%d] = %10.6e | erro relativo= %10.6e\n",k+1,x[k+1],ErrRel);

od;

end:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:24 lddkls221_met_mat

Assim, utilizando o código acima, encontramos que o valor de x que maximiza o


lucro da empresa é x = 0.158593439, que implica então que o lucro da empresa,
em bilhões de reais, é de 0.1585942.

0
AVANÇANDO NA PRÁTICA

seõçatona reV
VALOR MÁXIMO DA CONCENTRAÇÃO DE UM DADO POLUENTE
Suponha que uma certa área fluvial foi contaminada por uma empresa local com
um determinado agente tóxico. Sabendo que a concentração desse agente tóxico
varia de acordo com a função:
x
f (x) = 4cos(x) − e

Seu supervisor pediu para que você encontre o valor de x no intervalo de


concentração [0,1], tal que a concentração do agente tóxico seria necessariamente
igual a zero, assumindo uma precisão de 0,001. O “x”, nesse caso, seria a
concentração do tratamento utilizado para a remoção total do poluente nessa área
fluvial.

RESOLUÇÃO 

Perceba que, dado a complexidade da função, o uso de métodos numéricos é


fundamental. Assim, para encontrar o valor de x que corresponde à
concentração do tratamento, podemos utilizar o método de Newton-Rhapson,
por exemplo. Esse método é baseado nos passos:

Dado , vamos escrever , tal que  seja uma aproximação inicial e  tolerância.
Então:

1. Se |f (x 0)|  <  ε faça c  =  x e pare. 0

2. k  =  1.

3. x k = φ(xk−1) .

4. Se |f (x k)|  <  ε ou |x k  −  xk−1|  <  ε faça c  =  x e pare. 1

5 xk 1 = xk

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:24 lddkls221_met_mat

5. x k−1  =  xk .

6. k  =  k  +  1 e volte ao passo 3.

Logo, considerando como aproximação inicial o valor x 0 = 0,9 e realizando os

0
passos do método, temos:

seõçatona reV
k xk f (xk) f ′(xk) |xk − xk−1|

0 0,9 0,026837 -5,592911 -

1 0,904798 -0,000057 -5,616636 0,004798

2 0,904788 0 -5,616586 0,000010

Isto é, para remover totalmente o poluente no intervalo de concentração [0,1]


com uma precisão de 0,001, precisamos de aproximadamente uma
concentração de 0,904788217 do tratamento.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:24 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

INTERPOLAÇÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
PRATICAR PARA APRENDER
Caro aluno, nesta seção iremos entender o conceito de interpolação polinomial,
que consiste em aproximar uma função usando polinômios. Para isso, dois
métodos serão considerados: o método de Lagrange e o método de Newton. A
vantagem do uso da interpolação polinomial, por exemplo, é que se uma dada
função com forma complexa puder ser aproximada por um polinômio, então o
nosso trabalho na modelagem facilita bastante, pois os polinômios são mais
flexíveis para se trabalhar.

Como exemplo do uso do polinômio interpolador, considere a situação em que


você precisa modelar o lucro trimestral de sua empresa. Como, em geral, a curva
do lucro é complexa, você pode utilizar o polinômio de Lagrange para aproximá-la
e fazer a previsão do lucro. Uma alternativa a isso são os métodos estatísticos que
serão trabalhados posteriormente em outras seções.

Em determinada empresa de solventes químicos, deseja-se achar uma forma mais


eficiente de trabalhar com a demanda dos produtos. Pensando nisso, a empresa
resolveu ajustar o modelo que descrevia a demanda usando um polinômio
interpolador a partir método de Lagrange. No entanto, nenhum dos funcionários
tinha conhecimento sobre como fazer isso. Devido a essa carência, a empresa
então lhe contratou para resolver o problema. Sabendo que os pontos de
demanda eram baseados nos pontos , foi lhe requisitado a equação do polinômio
interpolar que passava por esses pontos a fim de entender como estava
funcionando a demanda da empresa. Dessa forma, você deveria apresentar a
solução passo a passo de como foi encontrado tal polinômio sem o uso de
métodos computacionais.

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo! Iniciaremos com os conceitos fundamentais de interpolação polinomial.
Em seguida, trabalharemos com métodos de interpolação, especialmente o mais
popular, que é o de Newton! 

CONCEITO-CHAVE

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/10
04/08/22, 09:24 lddkls221_met_mat

Anteriormente, exploramos os conceitos relativos a erros e encontrar soluções de 


f (x) = 0 a partir de métodos iterativos. Agora, o nosso foco será encontrar um
polinômio que aproxima a função f (x), chamado de polinômio interpolador. Para
começar nossos trabalhos neste tópico, vamos supor que que temos (n  +  1)

0
pontos distintos x 0,  x 1 ,  .  .  .  ,  x n , que iremos chamar de “nós”, e que os pontos 

seõçatona reV
y 0 ,  y 1 ,  .  .  .  ,  y n foram obtidos por meio de alguma função f desconhecida, isto
é, y i  =  f (x i ),  i  =  0, 1, .  .  .  ,  n . Queremos, então, conhecer ou estimar 
f (x r ) para algum valor x que não seja necessariamente tabelado. Um modo de
r

fazer isso é interpolar f por uma função polinomial, uma vez que, em geral, temos
conhecimento apenas dos pares de pontos (x i,  f (x i )) e não da expressão de f
em si.

Inicialmente, então, vamos verificar a questão da existência do polinômio


interpolador. Isto é, dados os n  +  1 pontos 
(x 0 ,  f (x 0 )),  (x 1 ,  f (x 1 )),  .  .  .  ,  (x n ,  f (x n )) , onde x 0,  x 1 ,  .  .  .  ,  x n são 
(n  +  1) pontos distintos. Nosso objetivo é encontrar uma função polinomial 
p n (x) , de grau máximo n, que satisfaça:

f (x i ) =  p n (x i ),  i  =  0, 1, .  .  .  ,  n.

Como p n (x) tem a forma

p n (x)  =  a n x n   +  a n−1 x n−1 +   ⋅   ⋅   ⋅   +  a 1 x  + a 0 ,

então f (x ) se transforma em:


i

n n−1
⎧ an x + a n−1 x + … + a 1 x 0 = f (x 0 )
0 0

⎨ …

⎩ n n−1
a n x n + a n−1 x n + … + a 1 x n = f (x n )

Com base nos conceitos de Álgebra Linear, podemos reescrever o sistema anterior
em forma de matriz como:
n
1 x0 … x a0 f (x 0 )
⎡ 0 ⎤ ⎡ ⎤ ⎡ ⎤
… … … … ⋅ … = …

⎣ n ⎦ ⎣ ⎦ ⎣ ⎦
1 xn … x an f (x n )
n

n
1 x0 … x
⎡ 0 ⎤

Em que A = … … … … é a matriz, tal que det A ≠ 0, pois


⎣ n ⎦
1 xn … xn

os pontos x 0,  x 1 ,  .  .  .  ,  x n são distintos e A é necessariamente uma matriz de


Vandermonde. Desse modo, o sistema linear em questão admite uma única
solução a 0,  a 1 ,  .  .  .  ,  a n . Em outras palavras, existe apenas um polinômio 

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/10
04/08/22, 09:24 lddkls221_met_mat

p n (x)  =  a n x n   +  a n−1 x n−1   +   ⋅   ⋅   ⋅   +  a 1 x  +  a 0 de grau menor ou igual


a n que interpola a função f . Esse polinômio é chamado de polinômio
interpolador.

0
ASSIMILE

seõçatona reV
Matematicamente, uma matriz é dita matriz de Vandermonde se todos os
termos de cada uma de suas linhas formam uma progressão geométrica.

Assim, podemos enunciar o seguinte resultado (ANDRADE, 2012):

Teorema: Dados x 0,  x 1 ,  .  .  .  ,  x n pontos distintos, existe um único polinômio 


p n (x) , de grau máximo n, que interpola f nos pontos 
(x i ,  f (x i )),  i  =  0, .  .  .  ,  n .

Existem diversos métodos para encontrar o polinômio interpolador, no entanto,


nesta seção, iremos trabalhar com dois desses métodos: (i) o método de Lagrange
e (ii) o método de Newton.

Iniciemos, então, com o método de Lagrange. Para esse método, vamos considerar
dados (n  +  1) pontos distintos x 0,  x 1 ,  .  .  .  ,  x n e 
y i   =  f (x i ),  i  =  0, 1, .  .  .  ,  n . Para cada k  =  0, 1, .  .  .  ,  n seja:
(x − x 0 )(x − x 1 ). . . (x − x k−1 )(x − x k+1 ). . . (x − x n )
L k(x) =
(x k − x 0 )(x k − x 1 ). . . (x k − x k−1 )(x k − x k+1 ). . . (x k − x n )

Ou resumidamente,
n x−x i
L k (x) = ∏ ,  k = 0,1, … ,  n.
i=0,i≠k x k −x i

É fácil notar que:

a. L k (x k )  =  1 ,

b. L k (x j ) =  0,  j ≠ k ,

c. L k (x)  é um polinômio de grau n.

Com isso, temos o seguinte resultado:

Teorema (Lagrange): Sejam x 0,  x 1 ,  .  .  .  ,  x n pontos distintos  e y i  =  f (x i ) , 


i  =  0, 1, .  .  .  ,  n dados. Então, existe um polinômio i  =  0, 1, .  .  .  ,  n de
grau menor ou igual a p n (x) que interpola f nesses pontos. Além disso, p n (x) é
dado por:

p n (x)  =  y 0 L 0 (x)  +  y 1 L 1 (x)  +   ⋅   ⋅   ⋅   +  y n L n (x),

onde:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/10
04/08/22, 09:24 lddkls221_met_mat

n x−x i
L k (x) = ∏ ,  k = 0,1, … ,  n.
i=0,i≠k x k −x i

EXEMPLIFICANDO

Vamos colocar em prática o método de Lagrange para encontrar o

0
polinômio que interpola os pontos 

seõçatona reV
(x k ,  y k ) = { (−1,0),  (0,1),  (1,2),  (2,7)} . Assim, pelo método de
Lagrange, obtemos:
(x−x 1 )(x−x 2 )(x−x 3 ) −x(x−1)(x−2)
L 0 (x) = =
(x 0 −x 1 )(x 0 −x 2 )(x 0 −x 3 ) 6

(x−x 0 )(x−x 2 )(x−x 3 ) (x+1)(x−1)(x−2)


L 1 (x) = =
(x 1 −x 0 )(x 1 −x 2 )(x 1 −x 3 ) 2

(x−x 0 )(x−x 1 )(x−x 3 ) −(x+1)x(x−2)


L 2 (x) = =
(x 2 −x 0 )(x 2 −x 1 )(x 2 −x 3 ) 2

(x−x 0 )(x−x 1 )(x−x 2 ) (x+1)x(x−1)


L 3 (x) = =
(x 3 −x 0 )(x 3 −x 1 )(x 3 −x 2 ) 6

Portanto, segue que o polinômio interpolador, segundo o método de


Lagrange, é dado por 
p(x) =  y 0 L 0 (x) +  y 1 L 1 (x) + y 2 L 2 (x) +  y 3 L 3 (x) =
2

3
x
3
+
1

3
x + 1 .

E como estimamos o erro com base no método de Lagrange? Vamos considerar 


(n  +  1) nós distintos x 0,  x 1 ,. .  .  ,  x n no intervalo [a,  b] e f : [a,  b]  →  R de
uma função. Então, para cada x  ∈  [a,  b] existe ξ x ∈ (a,  b) , tal que:
(n+1)(ξ x )
f
f (x) =  p n (x) + (x  −  x 0 )(x  −  x 1 ) ⋅   ⋅   ⋅  (x  −  x n ).
(n + 1)!

Assim, o erro para o polinômio de Lagrange é dado pela diferença |f (x) − p n (x)| .

Dessa forma, encerramos as questões teóricas do método de Lagrange. Mas, para


encerrar o conteúdo do método de Lagrange, vamos escrever um código que pode
ser utilizado no software Maple para encontrarmos o polinômio interpolador de
Lagrange (ANDRADE, 2012).

1 > restart;

2 > interpoLa := proc(pts) local i, j, k, polin, gr1, gr2, ‘check

arguments’;

3 > if type(pts, ‘list’) = false then

4 ERROR(‘o argumento deve ser uma lista de pontos do R^2’) fi;

5 > ‘check arguments’ := (pt) -> if type(pt, ‘list’) = false or nops(pt)

<> 2 then
6 ERROR(‘o argumento não é um ponto do R^2’, pt) else pt fi;

7 > map(‘check arguments’, pts);

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/10
04/08/22, 09:24 lddkls221_met_mat

8 > polin := sort(expand(sum(product((x-pts[j][1])/(pts[i][1]-pts[j][1]),

j = 1..i-1) * product((x-pts[k][1])/(pts[i][1]-pts[k][1]), k=

i+1...nops(pts)) * pts[i][2], i =1..nops(pts))),x);

9 print(polin);

0
10 > gr1 := plot(polin, x = 0..pts[nops(pts)][1];

11 > gr2 := plot(pts, style = point, symbol = circle, color = blue);

seõçatona reV
12 > plots[display]({gr1, gr2});

13 >end:

14 # Exemplo

15 interpoLa([[0,5], [1,3], [2,1], [3,3], [4,-3]])

Esse código transcreve exatamente o método de Lagrange aplicado no


Exemplificando dado anteriormente. Mas note que o método de Lagrange ainda
apresenta uma problemática grande quando adicionamos um ponto (x n+1 ,  y n+1 )

no sistema. Por quê? Note que ao usar esse método, adicionar um novo ponto
implica que devemos recalcular todos os polinômios 
L k (x),  i  = 0, 1, .  .  .  ,  n  +  1 . Como resolver essa questão? Bem, trabalhamos
com o método de Newton (ou método das diferenças divididas).

No método de Newton para o polinômio interpolador, ele é obtido a partir de uma


construção recursiva utilizando um operador que chamamos de operador das
diferenças divididas. Assim, para encontrar o polinômio interpolador p n (x) que
interpola f nos pontos x 0,  x 1 ,  .  .  .  ,  x n pelo método de Newton, utilizamos
(ANDRADE, 2012):

f [x 0 ]  =  f (x 0 ),  (ordem zero)

f [x 1 ]− f [x 0 ] f (x 1 )− f (x 0 )
f [x 0 ,  x 1 ] = = ,  (ordem 1)
x 1 – x 0 x 1 – x 0

f [x 1 , x 2 ]− f [x 0 , x 1 ]


f [x 0 ,  x 1 ,  x 2 ] = ,  (ordem 2)
x 2 − x 0

f [x 1 , x 2 , x 3 ]− f [x 0 , x 1 , x 2 ]


f [x 0 ,  x 1 ,  x 2 ,  x 3 ] = ,  (ordem 3)
x 3 − x 0

f [x 1 , x 2 , x 3 , …, x n ]− f [x 0 , x 1 , x 2 , …, x n−1 ]


f [x 0 ,  x 1 ,  x 2 ,  x 3 ,   …  ,  x n ] = ,  (ordem n)
x n − x 0

Chamamos f [x 0,  x 1 ,  x 2 ,  .  .  .  ,  x k ] de diferença dividida de ordem k entre os 


k  +  1 pontos x 0,  x 1 ,  x 2 ,  .  .  .  ,  x k . Um ponto importante que podemos
destacar é que as diferenças divididas f [x 0,  x 1 ,  x 2 ,  .  .  .  ,  x k ] são funções
simétricas nos seus argumentos (ANDRADE, 2012). Com base nesse operador,
podemos construir a seguinte tabela de diferenças divididas para o método de
Newton:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/10
04/08/22, 09:24 lddkls221_met_mat

xk f [x k ] f [x k , x k+1 ] f [x k , x k+1 , x k+2 ] f [x k , x k+1 , x k+2 , x k+3 ]

x0 f [x 0 ]

0
f [x 0 , x 1 ]

seõçatona reV
x1 f [x 1 ] f [x 0 , x 1 , x 2 ]

f [x 1 , x 2 ] f [x 0 , x 1 , x 2 , x 3 ]

x2 f [x 2 ] f [x 1 , x 2 , x 3 ]

f [x 2 , x 3 ]

x3 f [x 3 ]

Ou, no caso geral,

xk ORDEM 0 ORDEM 1 ... ORDEM N

x0 f [x 0 ]

f [x 0 , x 1 ]

x1 f [x 1 ] f [x 0 , x 1 , x 2 ]

… … f [x 0 , x 1 , … , x n ]

… … f [x n−2 , x n−1 , x n ]

f [x n−1 , x n ]

xn f [x 3 ]

Bom, agora que sabemos como funciona o operador de diferenças divididas,


vamos trabalhar com a construção do polinômio p n (x) que interpola f (x) nos
pontos x 0,  x 1 ,  x 2 ,  .  .  .  ,  x n segundo o método de Newton. Começando com o
polinômio que interpola f (x) em x  =  x e assim sucessivamente, 0

construiremos p k (x) , que interpola f (x) em 


x 0 ,  x 1 ,  x 2 ,  .  .  .  ,  x k ,  k = 1,  … ,  n . Assim, seja então p 0 (x) o polinômio de
grau zero, que interpola f (x)em x  =  x , tal que p 0 0 (x)  =  f [x 0 ] . Nesse caso,
para x ≠ x e x  ∈  [a,  b], temos que:
0

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/10
04/08/22, 09:24 lddkls221_met_mat

f [x]− f [x 0 ] f (x)− f (x 0 )
f [x 0 ,  x] = = ,
x – x 0 x – x 0

tal que:

f (x) =  f (x 0 ) +  (x – x 0 )f [x 0 ,  x],

0
onde p 0 (x) = f (x 0 ) . Então, chamaremos E 0 (x) = f (x) − p 0 (x) de erro ao se

seõçatona reV
aproximar f (x) por p 0 (x) . Agora, seja p 1 (x) o polinômio de grau menor do que 1
que interpola f (x) em x e x . Temos que: 0 1

f [x,x 0 ]− f [x 1 , x 0 ] f (x)− f (x 0 )−(x−x 0 )f [x 1 ,x 0 ]


f [x 0 ,  x 1 , x] = = ,
x – x 1 (x−x 0 )(x – x 1 )

tal que:

f (x) =  f (x 0 ) + (x − x 0 )f [x 1 , x 0 ] +  (x – x 0 )(x − x 1 )f [x 0 , x 1  x],

onde p 1 (x) =  f (x 0 ) + (x − x 0 )f [x 1 , x 0 ] . Então, chamaremos 


E 1 (x) = f (x) − p 1 (x) de erro cometido ao se aproximar f (x) por p 1 (x) . De
modo geral, repetindo o procedimento anterior n vezes, obtemos:

f (x) = f (x 0 ) + … + (x − x 0 ) … (x − x n−1 )f [x 0 , … ,  x n ] + (x − x 0 ) … (x − x n )f [x 0 , …

, onde 
p n (x) = f (x 0 ) + (x − x 0 )f [x 0 , x 1 ] + … + (x − x 0 ) … (x − x n−1 )f [x 0 , … ,  x n ]

e E n (x) = (x − x 0 ) … (x − x n )f [x 0 , … , x n ,  x] são o erro cometido ao se


aproximar f (x) por p n (x) . 

ASSIMILE

A forma de Newton para o polinômio p n (x) que interpola f (x) em  pontos
distintos é dada por 
p n (x) =  d 0   +  d 1 (x  −  x 0 ) +    ⋅   ⋅   ⋅   +  d n (x  −  x 0 )  ⋅   ⋅   ⋅  (x  −  x n−1 )

, onde d são as diferenças divididas de ordem k dadas por 


k

d k = f [x 0 ,  x 1 ,  x 2 ,  .  .  .  ,  x k ] . Além disso, se f é (n  +  1) vezes


diferenciável no intervalo [a,  b] que contém os pontos x , o erro E i n (x) é
dado por 
E n (x) = f (x) − p n (x) = (x  −  x 0 )(x  −  x 1 ) … (x  −  x n )f [x 0 ,  x 1 ,  .  .  .  ,  x n ,  x]

(ANDRADE, 2012).

EXEMPLIFICANDO

Vamos colocar em prática o método de Newton para encontrar o polinômio


interpolador nos pontos (x k,  y k ) = { (−1,0),  (0,1),  (1,2),  (2,7)} .
Assim, pelo método de Newton, obtemos:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/10
04/08/22, 09:24 lddkls221_met_mat

xk ORDEM 0 ORDEM 1 ORDEM 2 ORDEM 3

-1 0

0
1−0
= 1
0−(−1)

seõçatona reV
0 1
2−0−(1−(−1))⋅1
= 0
(1−(−1))(1−0)

1 2

1 2 2

2 7

Dessa maneira, o polinômio interpolador é dado por:

p 3 (x) = d 0 + d 1 (x − x 0 ) + d 2 (x − x 0 )(x − x 1 ) + d 3 (x − x 0 )(x − x 1 )(x − x 2 )

2
= (x + 1) + (x + 1)x(x − 1)
3

REFLITA

Pensando no método de Lagrange e no método de Newton, qual dos dois


trazem uma aproximação mais concisa de f (x)? Em qual deles o erro
cometido é menor? Na prática, qual é mais viável usar? Pense sobre essas
questões, especialmente em âmbito de custo computacional de tempo de
processamento.

Por fim, é válido ressaltar que os erros de interpolação são fundamentais,


especialmente quando trabalhamos com modelagem. Em qualquer trabalho que
envolva aproximação numérica, sempre estamos buscando pelo menor erro
possível e a magnitude desse erro nos traz a versatilidade do nosso modelo.
Pensando nesse aspecto, em métodos numéricos, existe um conceito chamado
fenômeno Runge que consiste em dizer que o erro é menor na zona central do
intervalo e maior nos extremos. Para evitar esse fenômeno, podemos considerar
pontos não igualmente espaçados juntamente com polinômios ortonormais,
splines ou aproximação por mínimos quadrados.

Com isso, finalizamos a nossa seção sobre polinômio interpolador, que é um dos
objetos fundamentais quando trabalhamos aproximações numéricas.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/10
04/08/22, 09:24 lddkls221_met_mat

FAÇA VALER A PENA


Questão 1
Interpolação de polinômios é baseada em métodos numéricos simples que nos
traz diversas informações sobre a função em questão. Dentre os métodos de

0
interpolação, destacam-se dois deles: o método de Lagrange e o método de
Newton.

seõçatona reV
Sobre o método de Lagrange, assinale o que for correto.

a. Na interpolação pelo método de Lagrange, são válidos: L k (x k )  , 


=  1 L k (x j ) =  0,  j ≠ k e L k (x) é um
polinômio de grau k.

b. Na interpolação pelo método de Lagrange, são válidos: L k (x k )  , 


=   − 1 L k (x j ) =  0,  j ≠ k e L k (x) é
um polinômio de grau k.

c. Na interpolação pelo método de Lagrange, são válidos: L k (x k )  , 


=  0 L k (x j ) =  1,  j ≠ k e L k (x) é um
polinômio de grau n.

d. Na interpolação pelo método de Lagrange, são válidos: L k (x k )  , 


=   − 1 L k (x j ) =  0,  j ≠ k e L k (x) é
um polinômio de grau n.

e. Na interpolação pelo método de Lagrange, são válidos: L k



(x k )  =  1 L k (x j ) =  0,  j ≠ k e L k
(x) é um
polinômio de grau n.  

Questão 2
Uma das grandes desvantagens do método de Lagrange é que a adição de mais
um ponto nos obriga a realizar todos os cálculos dos novos polinômios L, o que
pode ser um grande problema caso tenhamos muitos pontos. Porém, usando o
método de Newton, não temos esse problema.

A respeito do método de Newton, assinale o que for correto.

a.  No método de Newton para o polinômio interpolador, com diferenças divididas, podemos acrescentar ou
retirar pontos, uma vez que esse método faz uma construção recursiva simples utilizando um operador de
produto da diferença.

b.  No método de Newton para o polinômio interpolador, com diferenças divididas, podemos acrescentar ou
retirar pontos, uma vez que esse método faz uma construção discursiva simples utilizando um operador de
diferença dividida.

c.  No método de Newton para o polinômio interpolador, com diferenças divididas, podemos acrescentar ou
retirar pontos, uma vez que esse método faz uma construção recursiva simples utilizando um operador de
diferença dividida.

d.  No método de Newton para o polinômio interpolador, com diferenças aumentadas, podemos
acrescentar ou retirar pontos, uma vez que esse método faz uma construção recursiva simples utilizando
um operador de produto da diferença dividida.

e.  No método de Newton para o polinômio interpolador, com somas divididas, podemos acrescentar ou
retirar pontos, uma vez que esse método faz uma construção discursiva complexa utilizando um operador
de diferença subtraída.  

Questão 3

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/10
04/08/22, 09:24 lddkls221_met_mat

Quando trabalhamos com interpolação polinomial, devemos ter em mente que,


em geral, não melhoramos a precisão aumentando a quantidade de pontos ou nós
e, portanto, aumentando o grau do polinômio interpolador. Nesses aspectos,
temos grandes perdas na aproximação quando se trata dos extremos do intervalo.

0
Esse fenômeno é chamado de fenômeno Runge.

seõçatona reV
Sobre o fenômeno Runge, assinale o que for correto.

a.  Por definição, o fenômeno Runge é: o erro é maior na zona central do intervalo e menor nos extremos.
Para evitar esse fenômeno, podemos considerar pontos não igualmente espaçados juntamente com
polinômios ortogonais, splines ou aproximação por mínimos quadrados.

b.  Por definição, o fenômeno Runge é: o erro é menor na zona central do intervalo e maior nos extremos.
Para evitar esse fenômeno, podemos considerar pontos igualmente espaçados juntamente com polinômios
ortonormais, splines ou aproximação por mínimos quadrados.

c.  Por definição, o fenômeno Runge é: o erro é maior na zona central do intervalo e menor nos extremos.
Para evitar esse fenômeno, podemos considerar pontos não igualmente espaçados juntamente com
polinômios ortonormais, splines ou aproximação por mínimos quadrados.

d.  Por definição, o fenômeno Runge é: o erro é menor na zona central do intervalo e maior nos extremos.
Para evitar esse fenômeno, podemos considerar pontos não igualmente espaçados juntamente com
polinômios ortogonais, splines ou aproximação por mínimos quadrados.

e.  Por definição, o fenômeno Runge é: o erro é menor na zona central do intervalo e maior nos extremos.
Para evitar esse fenômeno, podemos considerar pontos não igualmente espaçados juntamente com
polinômios concorrentes, regressão linear ou aproximação por máximos quadrados. 

REFERÊNCIAS
ANDRADE, D. Cálculo numérico. In: NOTAS de aula. [S. l.], 2012.

FERNANDES, D. B. Cálculo Numérico. São Paulo: Editora Pearson, 2015.

FRANCO, N. B. Cálculo Numérico. São Paulo: Editora Pearson, 2006.

LOPES, Á. P.; COSTA, M. J. S. Comparação entre métodos de aproximação numérica


utilizando o programa MATLAB. Revista Margens Interdisciplinar, v. 11, n. 17, p.
14, 2018. Disponível em:
https://periodicos.ufpa.br/index.php/revistamargens/article/view/5447. Acesso em:
23 jun. 2021.

VALLE, M. E. MS211 - Cálculo Numérico Aula 15 – Interpolação Polinomial. [s.


d.]. Campinas: Unicamp. Disponível em:
https://www.ime.unicamp.br/~valle/Teaching/MS211/Aula15.pdf. Acesso em: 26
mar. 2021.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/10
04/08/22, 09:24 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


INTERPOLAÇÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Pensando em como resolver o problema usando o método de Lagrange para
determinar o polinômio que interpola os pontos 
(xk,  yk) = {(0,0), (1,3), (2,1), (3,3), (4,0)} , você buscou em seus ensinamentos
de cálculo numérico, para relembrar, como era feito tal método sem apoio
computacional. Assim, depois de muito esforço, você obteve, pelo método de
Lagrange, as equações:
(x−x1)(x−x2)(x−x3)(x−x4) (x−1)(x−2)(x−3)(x−4)
L0(x) = =
(x0−x1)(x0−x2)(x0−x3)(x0−x4) (0−1)(0−2)(0−3)(0−4)

(x−x0)(x−x2)(x−x3)(x−x4) (x−0)(x−2)(x−3)(x−4)
L1(x) = =
(x1−x0)(x1−x2)(x1−x3)(x1−x4) (1−0)(1−2)(1−3)(1−4)

(x−x0)(x−x1)(x−x3)(x−x4) (x−0)(x−1)(x−3)(x−4)
L2(x) = =
(x2−x0)(x2−x1)(x2−x3)(x2−x4) (2−0)(2−1)(2−3)(2−4)

(x−x0)(x−x1)(x−x2)(x−x4) (x−0)(x−1)(x−2)(x−4)
L3(x) = =
(x3−x0)(x3−x1)(x3−x2)(x3−x4) (3−0)(3−1)(3−2)(3−4)

(x−x0)(x−x1)(x−x2)(x−x3) (x−0)(x−1)(x−2)(x−3)
L4(x) = =
(x4−x0)(x4−x1)(x4−x2)(x4−x3) (4−0)(4−1)(4−2)(4−3)

Após vários cálculos para simplificação, você concluiu que o polinômio


interpolador, segundo o método de Lagrange, é dado por:

p(x) =  y0L0(x) +  y1L1(x) + y2L2(x) +  y3L3(x) + y4L4(x) = −


3

4
x
4
³
+ 6x −
61

4
²
x +13x

SEM MEDO DE ERRAR

POLUIÇÃO SONORA
A prefeitura de uma cidade X teve diversos relatos com problemas relacionados à
poluição sonora. Você, como um funcionário exemplar, salvou cada reclamação de
barulho em um banco de dados contendo a hora do acontecido e o nível de ruído
medido pelos equipamentos posicionados estrategicamente após as denúncias.
Analisando os dados, você notou que era possível avaliar o comportamento do
ruído usando interpolação polinomial e foi aos seus superiores falar sobre a

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:24 lddkls221_met_mat

descoberta. No entanto, você usou muitos termos técnicos e eles não entenderam
nada sobre o problema. Então, você pensou em maneiras de escrever a
informação resumindo a questão da interpolação do polinômio usando o método
de Newton, em que apresentaria a tabela das diferenças divididas e o polinômio

0
final. Descreva então como você realizaria essa apresentação sabendo que o

seõçatona reV
polinômio interpolador passa pelos pontos 
(0,1), (0.5,1.649), (1,2.718), (1.5,4.482), (2,7.389) .

RESOLUÇÃO 

Pensando em como resolver o problema usando o método de Newton para


determinar o polinômio que interpola os pontos 
(xk,  yk) = { (0,1), (0.5,1.649), (1,2.718), (1.5,4.482), (2,7.389)} , você buscou
em seus ensinamentos de cálculo numérico, para relembrar, como era feito tal
método sem apoio computacional. Assim, depois de muito esforço, você
obteve, pelo método de Newton:

xk ORDEM 0 ORDEM 1 ORDEM 2 ORDEM 3 ORDEM 4

0 1

1.298

0.5 1.649 0.84

2.138 0.36667

1 2.718 1.39 0.11533

3.5280 0.5973

1.5 4.482 2.286

5.814

2 7.389

Após uma álgebra básica, você concluiu que o polinômio interpolador, segundo
o método de Newton, é dado por:

p(x) = 1 + 1.298x + 0.84x(x − 0.5) + 0.36667x(x − 0.5)(x − 1) + 0.11533x(x − 0.5)(x − 1)

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:24 lddkls221_met_mat

Assim, com o polinômio interpolar em mãos, você pode apresentar à prefeitura


essa equação explicando a importância dela para fazer previsões a respeito do
ruído. Essas previsões são de suma importância, pois podem ajudar na
eficiência de controle do ruído e também prevenir reclamações futuras.

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:25 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

INTEGRAÇÃO NUMÉRICA

0
Ricardo Puziol de Oliveira

seõçatona reV
PRATICAR PARA APRENDER
Caro aluno, nesta seção vamos trabalhar basicamente com dois tópicos: regra dos
trapézios e regra de Simpson. Ambos os tópicos são ferramentas para aproximar o
valor de uma integral, consequentemente de uma área, usando métodos
numéricos. Essas ferramentas são importantes, pois, na prática, raramente temos
figuras regulares ou até mesmo funções bem-comportadas. A maioria dos
problemas são resolvidos usando métodos numéricos devido à versatilidade
desses métodos. Imagine só ter que lidar com a modelagem do crescimento
populacional ou até mesmo o aumento dos casos de Covid-19 sem fazer o uso de
métodos numéricos. Seria extremamente complexo! 

Em um estudo envolvendo Engenharia Biomédica, um determinado pesquisador


realizou um trabalho voltado para modelagem de marca-passo no coração de
pessoas idosas. Em sua pesquisa, ele tinha por interesse achar a área abaixo da
curva gerada pelos dados do marca-passo. Sabe-se que a função que governa o
marca-passo é descrita por:

f (x) = 0,3 + 20x − 140x +730x −810x ² ³ 4


+ 200x
5

no intervalo de 0,2 até 0,8 horas. Uma vez que ele tiver a área abaixo dessa curva e
sabendo que essa função tem certos padrões de repetição, ele conseguirá estimar
a área total para mais do que 0,6 horas, considerada em seu experimento para
avaliar a qualidade do marca-passo. Então, baseando-se nos conceitos de
integração numérica, como você calcularia a área abaixo da função dada
assumindo uma margem de erro de no máximo 1%? 

Conseguiu ver a importância desses conceitos? Que tal começarmos a trabalhar


com eles e entender melhor sob o ponto de vista matemático e prático? Não se
preocupe, vamos lhe acompanhar em todo o processo e os conceitos serão
construídos de forma gradual! 

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/9
04/08/22, 09:25 lddkls221_met_mat

CONCEITO-CHAVE
Já vimos anteriormente como trabalhar com os erros de aproximações e também
com formas de resolver a equação f (x) = 0. Agora, nos interessa saber como
resolver numericamente as integrais, uma vez que elas, assim como a equação 

0
f (x) = 0 , têm diversas aplicações em Engenharia, como no cálculo aproximado da

seõçatona reV
área de placas de metais em construção civil. Nesse aspecto, a ideia da integração
numérica consiste, basicamente, na aproximação da função integranda f por um
polinômio em que a escolha desse polinômio e dos pontos usados em sua
determinação vai resultar nos diversos métodos numéricos de integração. 

Em Cálculo Diferencial e Integral, é visto que as fórmulas de integração numéricas


são somatórios, em que suas parcelas são, necessariamente, valores de f (x)
calculados em pontos escolhidos e multiplicados por pesos convenientes, isto é,
b n
∫ f (x)dx ≈ ∑ ω i f (x i )
a i=0

onde a  ≤  x 0  <  x 1   <  .  .  .   <  x n   ≤  b são pontos de integração e os ω são i

os pesos. Então, para iniciar nossos estudos, nesta seção vamos considerar apenas
as fórmulas fechadas, isto é, os extremos de integração coincidem com x e x .  0 n

Dessa forma, dada uma função f   :  [a,  b]  →  R, seja n um número natural e 
h  =
b – a

n
, dizemos que os pontos x j = x 0 + j h ,  j  = 0, 1, .  .  .  ,  n são
igualmente espaçados (ANDRADE, 2012). Assim, seja P n (x) o polinômio de grau 
nh  =
b – a

n
que interpola os pontos (x i,  f (x i )),  i  =  0, 1, .  .  .  ,  n . Pelo
método de interpolação de Lagrange, sabemos que:
n
P n (x) =   ∑ f (x i )L i (x)
i=0

e o erro:
f (n+1)(α)
f (x) −  P n(x) = (x  −  x 0 )(x  −  x 1 ).  .  .  (x  −  x n ),
(n + 1)!

onde α  =  α(x) é um ponto em (a,  b). Assim, integrando em (a,  b), obtemos
que:
b n b b f (n+1)(α)
∫ f (x)dx = ∑ f (x i ) ∫ L i (x)dx + ∫ (x  −  x 0 )(x  −  x 1 ) .  .  .  (x  −  x n
a i=0 a a (n + 1)!

onde α  =  α(x) é um ponto em (a,  b). Nesse caso, podemos chamar:


b
ωi = ∫ L i (x)dx
a

a fim de simplificar a expressão de ∫ como:


b
f (x)dx
a

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/9
04/08/22, 09:25 lddkls221_met_mat

b n b f (n+1)(α)
∫ f (x)dx = ∑ ω i f (x i ) + ∫ (x  −  x 0 )(x  −  x 1 ) .  .  .  (x  −  x n )dx
a i=0 a (n + 1)!

que é conhecida como fórmula de Newton-Cotes para integrais numéricas. Como

0
caso particular dessa fórmula, obtemos as famosas fórmulas dos trapézios e de
Simpson, que são estabelecidas com polinômios de grau 1 e grau 2,

seõçatona reV
respectivamente. Vamos iniciar então com a fórmula dos trapézios, ou regra dos
trapézios.

A fórmula dos trapézios corresponde, basicamente, à interpolação da função a ser


integrada por um polinômio de grau 1 (ANDRADE, 2012). A interpolação linear,
nesse caso, necessita de dois pontos, então, vamos trabalhar com os extremos do
intervalo de integração, isto é, a  =  x e b  =  x . Logo, o polinômio linear
0 1

interpolador é dado por:


x − x 1 x − x 0
p 1 (x) =  y 0      +  y 1
x 0 − x 1 x 1 − x 0

em que y 0 = f (x 0 ), y 1 = f (x 1 ) são as coordenadas de y. E os pesos são dados


por:
x1 x − x 1 h
ω0   = ∫   dx = ,
x0 x 0 − x 1 2

x1 x − x 0
ω1   = ∫  
x0 x 1 − x 0

Para uma melhor visualização dessa ideia, vamos trabalhar com o gráfico exposto
na Figura 2.1.

Figura 1 - Lorem ipsum dolor sit amet

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/9
04/08/22, 09:25 lddkls221_met_mat

Fonte: elaborada pelo autor.

Assim, observando a Figura 2.1 e partindo dos pesos, temos que:

,
x1 h h

0
∫ f (x)dx = f (x 0 ) + f (x 1 ) + erro
x0 2 2

onde o erro é descrito pela seguinte equação:

seõçatona reV
1 x0 ′′
ET =  ∫ f (α)(x  −  x 0 )(x  −  x 1 )dx,
2 x1

onde α  =  αx é um ponto entre x e x . Agora, usando o teorema do valor


0 1

médio para integrais, obtemos que existe β  ∈  (x 0,  x 1 ) , tal que:


′′ 3
1 x0 ′′ f (β)h
ET =  ∫ f (α)(x  −  x 0 )(x  −  x 1 )dx = −
2 x1 12

Portanto, podemos escrever a fórmula dos Trapézios para integração numérica


como:
′′ 3

,
x1 h h f (β)h
∫ f (x)dx = f (x 0 ) + f (x 1 ) −
x0 2 2 12

onde β  ∈  (a,  b) não é conhecido.

REFLITA

Como você acha que fica a fórmula dos trapézios se for aplicada diversas
vezes sobre subintervalos de um intervalo geral [a, b]?

Vimos então como resolvemos a regra dos Trapézios usando um polinômio


interpolador de grau 1. E para a regra de Simpson, como procedemos? Nesse caso,
vamos interpolar f (x) usando um polinômio de grau 2 que coincida com essa
função em x 1 =
a + b

2
,  e b  =  x . Assim, o polinômio interpolador de grau 2 é
2

dado pela equação:


(x – x 1 )(x – x 2 ) (x – x 0 )(x – x 2 ) (x – x 0 )(x – x 1 )
p 2 (x) =  y 0 +  y 1 +  y 2 .
(x 0 – x 1 )(x 0 – x 2 ) (x 1 – x 0 )(x 1 – x 2 ) (x 2 – x 0 )(x 2 – x 1 )

em que y 0 = f (x 0 ), y 1 = f (x 1 ), y 2 = f (x 2 ) são as coordenadas de y. Para uma


melhor visualização dessa ideia, vamos trabalhar com o gráfico exposto na Figura
2.2.

Figura 2.2 | Regra de Simpson

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 4/9
04/08/22, 09:25 lddkls221_met_mat

0
Fonte: elaborada pelo autor.

seõçatona reV
Dessa forma, a partir dos polinômios de Lagrange, obtemos os pesos da fórmula
de Simpson:
x2 (x − x 1 )(x−x 2 ) h
ω0 = ∫   dx =
x0 (x 0 − x 1 )(x 0 −x 2 ) 3

x2 (x − x 0 )(x−x 2 ) h
ω1 = ∫   dx =
x0 (x 1 − x 0 )(x 1 −x 2 ) 3

x2 (x − x 0 )(x−x 1 ) h
ω2 = ∫   dx =
x0 (x 2 − x 0 )(x 2 −x 1 ) 3

Assim, obtemos a seguinte solução para a integral:

,
x2 h
∫ f (x)dx = [f (x 0 ) + 4f (x 1 ) + f (x 2 )] + erro
x0 3

onde o erro é dado pela seguinte expressão:


5
1 x1 (3) h (4)
ES = ∫ f (α)(x – x 0 )(x – x 1 )(x – x 2 )dx =   − [ ]f (β)
3! x0 90

para algum β  ∈  (x 0,  x 2 ) . Portanto, a fórmula de Simpson para integração


numérica é descrita pela equação:
5
x2 h h (4)
∫ f (x)dx = [f (x 0 ) + 4f (x 1 ) + f (x 2 )] + −[ ]f (β)
x0 3 90

REFLITA

Como você acha que fica a fórmula de Simpson se for aplicada diversas
vezes sobre subintervalos de um intervalo geral [a, b]?

ASSIMILE

Embora as fórmulas dos trapézios e de Simpson usem polinômios de grau


baixo, note que, em termos de erros, a regra de Simpson não apresenta
termos simples como acontece na regra dos trapézios.

Agora, vamos avaliar outros aspectos dessas fórmulas: intervalos de integração


grandes. Quando o intervalo de integração é grande, em geral, não é conveniente
aumentar o grau do polinômio interpolador para obter fórmulas mais precisas,
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 5/9
04/08/22, 09:25 lddkls221_met_mat

pois podemos deixar o problema ainda mais complexo. A alternativa mais usada é
subdividir o intervalo de integração e aplicar fórmulas simples repetidas vezes,
obtendo-se as fórmulas compostas. Vamos começar com a regra dos trapézios
composta.

0
Nesse caso, de acordo com Andrade (2012), dado o intervalo [a,  b] dividindo-o em 

seõçatona reV
n subintervalos de comprimento h  = b – a

n
e fazendo x 0  , 
=  a x i   =  x 0   +  ih , 
i  =  0, 1, .  .  .  ,  n e x n = b , obtemos:
b n xi
∫ f (x)dx = ∑ ∫ f (x)dx
a i=1 x i−1

x1 x2 xn
= ∫ f (x)dx + ∫ f (x)dx + … + ∫ f (x)dx
x0 x1 x n−1

h h h
≈ [f (x 0 ) + f (x 1 )] + [f (x 1 ) + f (x 2 )] + … + [f (x n−1 ) + f (x n )]
2 2 2

h n−1
≈ [f (x 0 ) + 2 ∑ f (x i ) + f (x n )].
2 i=1

que é chamada de fórmula composta para a regra dos trapézios. Nesse caso, o
erro final dessa fórmula tem como base os erros parciais da fórmula simples dos
trapézios que são dados por:
3
h
− f ′′(β i )
12

Logo, o erro final é dado por:


3
h
ET c = − [f ′′(β 1 ) + f ′′(β 2 ) +   ⋅   ⋅   ⋅ + f ′′(β n )]
12

Isto é,
3
h ′′
|E T c | ≤ (b − a) sup{|f (x)|;  x ∈ [a, b]}
12

E para a regra de Simpson, como procedemos? Nesse caso, dado o intervalo [a,  b]
dividindo-o em n subintervalos de comprimento h  = b – a

n
e fazendo x 0 = a , 
x i = x 0 + ih,  i  =  0, 1, .  .  .  ,  n e x n = b , obtemos:
b x2 x4 xn
∫ f (x)dx = ∫ f (x)dx + ∫ f (x)dx + … + ∫ f (x)dx
a x0 x2 x n−2

h h
≈ [f (x 0 ) + 4f (x 1 ) + f (x 2 )] + … + [f (x n−2 ) + 4f (x n−1 ) + f (x n )]
3 3

n n−2
h 2 2
≈ [f (x 0 ) + 4 ∑ f (x 2i−1 ) + 2 ∑ f (x 2i ) + f (x n )
3 i=1 i=1

que é conhecida como fórmula composta para a regra de Simpson. Da mesma


forma que na regra dos trapézios composta, o erro final da regra composta de
Simpson pode ser obtido pela soma dos erros parciais. Portanto, o erro final da

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 6/9
04/08/22, 09:25

regra composta de Simpson é dado por:

|E Sc | ≤ (b  −  a)

ASSIMILE

EXEMPLIFICANDO

pois sup|f
n > 40,8

pois max
an =
h
1
f
′′

> 5,08
h

180
4

Vamos trabalhar com a integral ∫

(x)| ≤ 2

(4)

integral por métodos numéricos.


(x)
max{ f

12
−4

180

< 12
∣ (4)

Se f é um polinômio no qual seu grau é menor que 3, então o erro |E

Simpson e dos trapézios. Quantos subintervalos devemos usar para


calcular essa integral com uma tolerância de até 10 ?
1

Começamos então com a regra dos Trapézios. Nesse caso, o erro total é
dado por:

|E T c | ≤ (b − a)
h
3

sup{|f
′′
lddkls221_met_mat

(x) ;  x  ∈  [a,  b]}

nulo, isto é, a regra de Simpson é exata para polinômios de grau menor que
3 (ANDRADE, 2012).

Para finalizar nosso estudo de integração numérica, vamos trabalhar com um


exemplo de cálculo de integral com base nas regras de Simpson e dos trapézios
com erro menor que 10 .

exp(−x )dx

(x)|;  x ∈ [a, b]} ≤

. Assim, segue que h < 2,44 × 10


, isto é, precisamos de aproximadamente 41 intervalos. Agora,
para a regra de Simpson, temos que o erro total é:

|E Sc | ≤ (b  −  a)
h
4

max{ f
(4)
2

(x) ;  x  ∈  [a,  b]} =

. Assim, segue que h ≤ 1,96 × 10


, isto é, precisamos de apenas 6 intervalos para calcular a

Como exercício prático, você pode escrever a aproximação da integral


considerando pela regra de Simpson e pela regra dos trapézios usando 6
intervalos. Para finalizar, deixo a reflexão: qual desses métodos é mais viável
quando eu tenho uma integral mais complexa?
usando as regras de

12
−4

h
2
< 10

−2

12

180
−4

e, portanto, 

−1
4
< 10

e então 
Sc |

−4
é

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 7/9
04/08/22, 09:25 lddkls221_met_mat

FAÇA A VALER A PENA


Questão 1
As aplicações de integração numérica envolvem um rol de áreas e podem ser
encontradas em tipos de situações mais comuns, em geral. No entanto, existem

0
aplicações bem específicas para seu uso em algumas áreas, como Topografia e
Engenharia.

seõçatona reV
Com base em aplicações de integração numérica, assinale a alternativa que
contém exemplos dessas aplicações na área de Topografia e Engenharia.

a.  O cálculo da força resultante devido a um vento não uniforme soprando contra a lateral de um arranha-
céu que, geometricamente, simboliza um cálculo de área (Topografia); área de um campo delimitado por um
córrego sinuoso e duas estradas (Engenharia Urbana).

b.  Área entre duas curvas que representam as veias próximas ao coração (Topografia); o cálculo da força
resultante de um corpo em trajetória oblíqua, isto é, a área abaixo da trajetória (Engenharia Química).

c.  Área de um campo delimitado por um córrego sinuoso e duas estradas (Topografia); o cálculo da força
resultante devido a um vento não uniforme soprando contra a lateral de um arranha-céu que,
geometricamente, simboliza um cálculo de área (Engenharia Estrutural).

d.  Área de um campo delimitado por um córrego sinuoso e duas estradas (Topografia); área da seção
transversal de um rio (Engenharia Civil).

e.  Área da seção transversal de um rio (Topografia); o cálculo da força resultante devido a um vento não
uniforme soprando contra a lateral de um arranha-céu que, geometricamente, simboliza um cálculo de área
(Engenharia Mecânica).

Questão 2
Quando trabalhamos com áreas que, em geral, são estimadas por integrais,
devemos levar em conta que nem sempre é possível obter o valor exato dessa
integral, fazendo-se assim os métodos numéricos necessários para a solução do
problema. Nesse aspecto, há duas situações que é impossível encontrar o valor
exato de uma integral.

A respeito dessas situações, assinale a alternativa correta.

a.  A primeira situação decorre do fato de que, para usar o Teorema Fundamental do Cálculo, precisamos
conhecer uma antiderivada de f e às vezes isso é impossível. E a segunda situação ocorre quando a função é
determinada a partir de um experimento científico ou dados coletados.

b.  A primeira situação decorre do fato de que, para usar o Teorema Fundamental do Cálculo, precisamos
conhecer uma antiderivada de f e isso é sempre possível. E a segunda situação ocorre quando a função é
determinada a partir de um experimento científico ou dados coletados.

c.  A primeira situação decorre do fato de que, para usar o Teorema Fundamental do Cálculo, precisamos
conhecer uma antiderivada de f e às vezes isso é impossível. E a segunda situação ocorre quando a função é
determinada a partir de um experimento aleatório ou dados pré-definidos.

d.  A primeira situação decorre do fato de que, para usar o Teorema Fundamental do Cálculo, não
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 8/9
04/08/22, 09:25 lddkls221_met_mat

d.   p e a s tuação deco e do ato de que, pa a usa o eo e a u da e ta do Cá cu o, ão


precisamos conhecer uma antiderivada de f e às vezes isso é impossível. E a segunda situação ocorre
quando a função é determinada a partir de um experimente científico ou dados coletados.

e.  A primeira situação decorre do fato de que, para usar o Teorema Fundamental do Cálculo, não
precisamos conhecer uma antiderivada de f e isso é sempre possível. E a segunda situação ocorre quando a
função é determinada a partir de um experimento casual ou dados definidos.  

0
seõçatona reV
Questão 3
Antes de aplicar uma das regras de integração numérica, é fundamental que
encontremos o número de subintervalos a serem considerados para a aplicação de
cada uma das regras. Para entender melhor esse conceito, considere a integral:

π
∫ sen(x)dx
0

Com uma precisão de 5 casas decimais.

a. Simpson: 3; trapézios: 150.

b. Simpson: 1; trapézios: 251.

c. Simpson: 2; trapézios: 315.

d. Simpson: 4; trapézios: 719.

e. Simpson: 5; trapézios: 891. 

REFERÊNCIAS
ANDRADE, D. Cálculo numérico. In: NOTAS de aula. [S. l.], 2012.

FERNANDES, D. B. Cálculo Numérico. São Paulo: Editora Pearson, 2015.

FRANCO, N. B. Cálculo Numérico. São Paulo: Editora Pearson, 2006.

HFM. Integração Numérica. CN15. 2010. Disponível


em: https://homepages.dcc.ufmg.br/~hfmatos/CN/mirlaine/aula15.pdf. Acesso em:
26 mar. 2021. 

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 9/9
04/08/22, 09:25 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


INTEGRAÇÃO NUMÉRICA

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Pela definição de área sobre a curva, poderíamos calcular a área exata usando a
integração comum dada por:
0,8

∫ (0,3 + 20x − 140x +730x −810x ² ³ 4 5


+ 200x )dx = 12,8237
0,2

No entanto, foi solicitado o uso de métodos numéricos. Nesse caso, podemos


proceder usando a regra dos trapézios com 6 subintervalos. Isto é, para n = 6,
temos que h = 0,1 e assim:
(0,8−0,2)
I = = [f (0,2) + 2(f (0,3) + f (0,4) + f (0,5) + f (0,6) + f (0,7)) + f (0,8)]
(2)(6)

Assim, calculando o erro da estimativa, obtemos:

E T = (12,8237 − 12,76) = 0,0637

Isto é, utilizando 6 subintervalos, obtemos um erro com a porcentagem ,


0,0637

12,8237
⋅ 100 ≅ 0,498%  que é menor que 1%.

AVANÇANDO NA PRÁTICA

ÁREA AFETADA POR INCÊNDIOS


Em um estudo envolvendo Engenharia Florestal, um determinado pesquisador
realizou um trabalho voltado para modelagem da área afetada por incêndios. Em
sua pesquisa, ele tinha por interesse achar a área abaixo da curva gerada pelos
dados dos incêndios florestais. Sabe-se que a função que governa os incêndios é
descrita por:
4
f (x) =
1+x ²

no intervalo de 0 até 1 (em horas). No entanto, por não entender muito de


métodos numéricos, ele lhe contratou para fazer uma avaliação. Ao analisar a
função e os dados, você concluiu que uma integral pela regra de Simpson seria

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/2
04/08/22, 09:25 lddkls221_met_mat

suficiente para resolver o problema do pesquisador. Então, baseando-se nos


conceitos de integração numérica, especialmente na regra de Simpson, como você
calcularia a área abaixo da função dada assumindo um passo de integração de h =
0,25?

0
RESOLUÇÃO 

seõçatona reV
Pela definição da regra de Simpson e com passo de integração h = 0,25, temos
que:
b−a 1−0
m = = = 4
h 0,25

Que nos leva à seguinte tabela:

I xi yi

0 0 1

1 0,25 0,9412

2 0,5 0,8

3 0,75 0,64

4 1 0,5

Logo, 
0,25
I = (1 + 4 × 0,9412 + 2 × 0,8 + 4 × 0,64 + 0,5) = 0,7854
3

Assim, a área, de acordo com a regra de Simpson, é dada por:

4I = 4 × 0,7854 = 3,1416

Conforme desejado pelo pesquisador.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/2
04/08/22, 09:25 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA

0
Ricardo Puziol de Oliveira

seõçatona reV
CONVITE AO ESTUDO
Caro aluno, o que você pensa quando escuta o termo probabilidade? E o termo
estatística? Seria algo como sendo a chance de conseguir alguma coisa, como a
chance de vencer em um jogo de videogame ou a chance de ter sucesso com sua
startup? Se você pensa dessa forma, você pensa de maneira estatística!

Nesta unidade, vamos trabalhar com os principais conceitos de estatística e


probabilidade, iniciando com a história da probabilidade. Logo em seguida, vamos
trabalhar com as definições de população e amostra que se fazem fundamental na
estatística, sendo o carro-chefe dessa disciplina. Por fim, vamos entender como se
faz uma amostragem. Os processos de amostragem são diversos na literatura, mas
nosso foco aqui será a diferença entre uma amostragem probabilística e uma não
probabilística. Além disso, vamos trabalhar também com as medidas de tendência
central e dispersão e o modelo de regressão que envolve a correlação das
variáveis.

Algo que você pode estar se perguntando é: mas como utilizamos a estatística e a
probabilidade em áreas como Engenharia? Para exemplificar, suponha que você
trabalha com energia solar e seu objetivo seja criar tipos de telhados que
proporcionem o uso desse tipo de energia. Nesse caso, você irá realizar um
experimento para avaliar se sua proposta traz algum tipo de vantagem para a
produção do telhado. Só pelo fato de realizar um experimento, você já está
trabalhando com estatística e, posteriormente, para avaliar os resultados desse
experimento, você irá precisar de métodos estatísticos e probabilísticos para trazer

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/14
04/08/22, 09:25 lddkls221_met_mat

uma confiança em seu projeto, como um modelo de regressão. Viu como a


estatística é importante nesse aspecto? Para lhe auxiliar, vamos, no decorrer desta
unidade, aprender um pouco mais sobre ela! Então, mãos à obra! 

0
PRATICAR PARA APRENDER

seõçatona reV
Caro aluno, nesta seção iremos entender o conceito de estatística e de
probabilidade e como aplicar esses conceitos na prática. Com isso, você
compreenderá a importância do papel da estatística quando se trata de dados
dispostos em tabelas e como realizar operações com esses dados.

Como exemplo dessa abordagem, podemos considerar uma experimentação a


respeito de pressão hidráulica em automóveis, ou até mesmo gasto de
combustível. Dessa experimentação, você irá obter um conjunto de dados os quais
podem ser descritos utilizando métodos estatísticos, a fim de se atingir o objetivo
da pesquisa ou do trabalho, que pode ser, por exemplo, o tamanho amostral para
verificar o gasto médio de combustível de veículos de uma marca X, o tempo de
duração de uma válvula hidráulica, entre outros. Portanto, para atingir tais
objetivos, o uso da estatística permite um melhor entendimento e interpretações
do experimento em questão.

Em um dos seus trabalhos como Engenheiro Ambiental de uma determinada


cidade, foi lhe solicitado para fazer coletas de amostras de água de alguns rios da
região para avaliar o índice de qualidade da água a fim de monitorar o nível de
poluição. No entanto, ninguém da sua equipe tem ideia de como fazer a
amostragem. Sabendo que é necessária uma compra de material, você precisa
realizar um plano amostral para fazer essa coleta, uma vez que seus recursos
estão limitados devido ao corte de investimento da prefeitura dessa cidade. Além
disso, o prefeito necessita urgentemente desse plano amostral. Como você o faria
sabendo que seus recursos são limitados? Qual método de amostragem você
utilizaria para uma melhor eficiência dos seus recursos sabendo que foi lhe pedido
que a probabilidade de coleta de uma amostra deve ser a mesma em todos os rios
selecionados?
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/14
04/08/22, 09:25 lddkls221_met_mat

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo! Iniciaremos com os conceitos de probabilidade e de estatística e, depois,
passaremos para amostragem e aplicações!

0
CONCEITO-CHAVE

seõçatona reV
Você já parou para pensar em como as coisas ao nosso redor acontecem de forma
aleatória? Por exemplo, o cair de uma fruta de uma árvore, uma batida de carro, a
queda de um avião, a subida/descida da bolsa de valores, etc. Poucas coisas são,
de fato, determinísticas. Nesta seção, vamos explorar esses conceitos e definir o
que chamamos de probabilidade, que se faz uma ferramenta mais do que
fundamental atualmente e nas mais diversas áreas de trabalho.

No que tange ao contexto histórico, acredita-se que essa teoria teve seu início com
os matemáticos franceses Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665),
quando eles conseguiram derivar probabilidades exatas para determinados
problemas de jogos envolvendo dados. Atualmente, essa teoria é aplicada em
diversas áreas de estudo como hidrologia, medicina, farmacologia, engenharia,
química, educação, dentre outras. 

Ao estudar probabilidade, duas coisas são levadas em consideração: experimentos


e eventos. Um experimento é um processo, seja real ou hipotético, no qual são
identificados os resultados no decorrer do tempo. Por outro lado, um evento é um
conjunto bem definido relativo aos resultados de um experimento, seja ele real ou
hipotético. Além disso, existem duas classificações para os experimentos:
aleatórios e determinísticos. Dizemos que um dado experimento é dito aleatório
se, mesmo repetindo-o diversas vezes em condições iguais, o resultado não pode
ser definido ou, até mesmo, predito. Em contrapartida, dizemos que um
experimento é dito determinístico se, repetido diversas vezes, o resultado pode ser
definido ou predito.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/14
04/08/22, 09:25 lddkls221_met_mat

Um outro elemento fundamental em probabilidade é o espaço amostral. Podemos


definir espaço amostral como sendo o “conjunto relativo a todos os resultados
possíveis que podemos encontrar em um experimento aleatório” (MAGALHÃES,
2002). Denotamos espaço amostral por Ω. Por exemplo, suponha que desejamos

0
representar todas as plantas que produzem O . Nesse caso, Ω = {Todas as plantas 2

seõçatona reV
que produzem O } que define as características comuns aos membros do
2

conjunto. Outro exemplo é o lançamento de uma moeda. Nesse caso, Ω = {cara,


coroa} que são as únicas possibilidades de ocorrência no lançamento da moeda.
Em especial, os conjuntos de um espaço amostral possuem algumas propriedades
especiais, dado Ω um espaço amostral; A, B e C três subconjuntos de um espaço
amostral Ω, então as seguintes propriedades são válidas:

1. União: A ∪ B  =  {x ∈  Ω,  x ∈  A ou x ∈  B}.

2. Interseção: A ∩ B  =  {x ∈ Ω,  x ∈ A e x ∈ B}.

3. Complementar: A c
=  {x ∈ Ω,  x ∉ A} .

4. Eventos Mutuamente Exclusivos: A ∩ B  = ∅.

5. Lei Comutativa: A ∪  B  =  B ∪  A ou A ∩  B  =  B ∩ A.

6. Lei Associativa: (A ∪  B) ∪  C  =  A ∪  (B ∪  C).

7.  Lei Distributiva: (A ∪  B) ∩  C  =  (A ∩  C) ∪  (B ∩  C) ou 


(A ∩  B) ∪  C  =  (A ∪  C) ∩  (B ∪  C) .

8. Lei de Morgan: (∪ e (∩ .


c c
n n c n n c
Ai )   = ∩ A Ai ) = ∪ A  
i=1 i=1 i i=1 i=1 i

Voltando ao contexto de probabilidade, na literatura, três interpretações diferentes


de probabilidade são consideradas, a saber: a interpretação frequentista, a
interpretação clássica e a interpretação subjetiva. É importante destacar que cada
uma dessas interpretações pode ser útil na aplicação da teoria das probabilidades
a problemas práticos. Vamos começar então com a interpretação frequentista.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/14
04/08/22, 09:25 lddkls221_met_mat

Interpretação frequentista: seja A um evento qualquer. Se n é o número de A

ocorrências do evento A em n repetições independentes do experimento, então


dizemos que a probabilidade em que A ocorre é:

0
nA
P (A) =  lim n→∞
n

seõçatona reV
EXEMPLIFICANDO

Considere n lançamentos nas mesmas condições de uma moeda. Sendo o


evento A = {obter uma face cara}, do ponto de vista frequentista, a
probabilidade de ocorrer o evento A é igual a  , pois o limite da frequência 1

relativa de cara, quando a moeda é lançada em um grande número de


vezes em condições semelhantes, tende ao valor  . 1

Interpretação clássica: seja Ω um determinado espaço amostral e A um evento


dado. Se N (Ω) é o número de elementos possíveis no nosso espaço amostral Ω e
N(A) é o número de elementos possíveis no nosso evento A, então dizemos que a
probabilidade em que A ocorre é:
N (A)
P (A) =
N (Ω)

Vale ressaltar que se um experimento aleatório tem como espaço amostral 


Ω = {e 1 , e 2 , … , e n } , então podemos dizer que eventos elementares {e i} são
equiprováveis se, porventura, todos esses eventos terem a mesma probabilidade
de ocorrência, isto é:
1
P ({e i }) =
n

Logo, considerando tais eventos, podemos definir a probabilidade de ocorrência


de um dado evento E = {e j1 , … , e jk } , com k < n elementos, da seguinte
forma:
ú á
n mero de casos f avor veis a E k
P (E) = =
número de casos possíveis de Ω n

EXEMPLIFICANDO

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/14
04/08/22, 09:25 lddkls221_met_mat

Considere o lançamento de um dado em que o espaço amostral 


Ω = {1, 2, 3, 4, 5, 6} é equiprovável. Dado o evento A = {sair número par
na face em um lançamento de um único dado}, de acordo com a
interpretação clássica, o número de elementos do evento A  =  {2, 4, 6} é

0
igual a 3 e a probabilidade de ocorrência do evento A é dada por:

seõçatona reV
N (A) 3
P (A) = =
N (Ω) 6

Interpretação subjetiva: se o julgamento das probabilidades relativas de várias


combinações de resultados preencher determinados requisitos de consistência,
então as probabilidades subjetivas dos diferentes eventos possíveis podem ser
excepcionalmente determinadas.

EXEMPLIFICANDO

Suponha que uma moeda é lançada uma vez. Uma pessoa sem informação
especial sobre a moeda ou a maneira que ela é jogada, pode considerar
que uma cara e uma coroa têm resultados igualmente prováveis.
Entretanto, a pessoa que está jogando a moeda pode sentir que uma cara é
muito mais provável de ser obtida do que uma coroa e atribuir uma
probabilidade diferente.

Agora que sabemos como interpretar uma probabilidade, vamos definir mais dois
conceitos importantes: população e amostra. No que tange a esses conceitos, uma
população pode ser definida como “grupo de indivíduos com característica(s) em
comum”. Já uma amostra, podemos definir como “parte da população”, isto é, uma
porção de indivíduos que usaremos para inferir respostas sobre a população. No
que tange à seleção de uma amostra, ela pode ser feita de diversas maneiras,
porém, em muitos casos, depende exclusivamente dos recursos disponíveis para a
coleta dos dados.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/14
04/08/22, 09:25 lddkls221_met_mat

Em estatística utilizamos uma notação própria para diferenciar medidas usadas


para descrever características da amostra e da população. Assim, podemos definir
uma estatística como sendo uma medida de descrição de alguma característica da
amostra. Por exemplo,X  a média da amostra; S representa desvio-padrão da

0
¯
Xd amostra; P a proporção da amostra e  a diferença de médias são estatísticas. Já

seõçatona reV
um parâmetro pode ser definido como uma medida usada com finalidade de
descrever uma característica da população e, diferente da amostra, é representado
por uma letra grega. São exemplos de parâmetros: μ (média populacional); π
(proporção populacional); σ (desvio-padrão populacional) e μ (diferença de d

médias populacionais). Os dois problemas básicos da estatística são: estimação e


testes de hipóteses. Vamos, por meio de um exemplo, ilustrar essas duas
situações.

Suponha que determinado engenheiro químico está interessado em avaliar a


média de produção de um determinado efluente, μ, para o tratamento de água
nas seguintes condições: rio contaminado por aproximadamente 5 anos com água
de péssima qualidade e ecossistema aquático (peixes) degradado. Nesse caso, a
nossa população consiste em todas as dosagens da concentração do efluente nas
condições citadas. Assim, com os valores de concentração, podemos obter a
estimativa da média de produção verdadeira do efluente. 

Esse é um exemplo de problema de estimação. Por outro lado, suponha que o


engenheiro químico deseja saber se a média de produção do efluente A é a mesma
da média de produção do efluente B. Para realizar tal comparação, foi considerada
uma amostra aleatória de 50 concentrações do efluente B e 50 do efluente A, sob
as mesmas condições. Esse é um exemplo de problema de teste de hipóteses.

REFLITA

Em que outras situações práticas você pode encontrar as diferenças entre


os problemas de estimação e testes de hipóteses?

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/14
04/08/22, 09:25 lddkls221_met_mat

Agora, para encerrar nosso conteúdo da seção, vamos lidar com a amostragem,
que é uma das principais ferramentas da estatística. Como vimos nos exemplos
anteriores, um pesquisador trabalha apenas com a amostra, visto que, em muitos
casos, trabalhar com a população toda é impossível. A maneira como é selecionada

0
uma amostra é de extrema importância, pois é através dos dados amostrais que

seõçatona reV
estimamos os parâmetros da população para fazer inferências sobre ela. Existem
diversas formas/técnicas de se realizar uma amostragem, porém, nesta seção,
iremos nos limitar a trabalhar com a amostragem aleatória simples para o uso das
técnicas estatísticas aqui apresentadas.

Então, podemos definir a amostragem aleatória simples como sendo uma técnica
em que todos os indivíduos de uma dada população têm a mesma probabilidade
de serem selecionados para a amostra. Em outras palavras, seria análogo à ideia
de um sorteio de números como na Mega-Sena, em que temos 60 números na
“população” e escolhemos 6 desses números. A escolha de cada um dos 6 números
tem a mesma probabilidade.

Para facilitar o processo de amostragem aleatória simples, podemos dividi-lo em


etapas:

1. Definir a população-alvo.

2. Definir um quadro par ao processo de amostragem.

3. Avaliar os recursos disponíveis para execução do quadro de amostragem.

4. Atribuir um número único para cada individuo.

5. Determinar o tamanho da amostra.

6. Realizar a amostragem aleatória simples.

Assim como toda técnica de amostragem, a amostragem aleatória simples tem


suas vantagens e desvantagens. Entre as vantagens, destacamos:

1. A probabilidade de seleção de um indivíduo é a mesma para todos os


indivíduos.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/14
04/08/22, 09:25 lddkls221_met_mat

2. Em geral, esse método traz amostras representativas.

3. Os métodos estatísticos, para lidar com esse tipo de amostragem, são mais
simples.

0
No entanto, as desvantagens desse tipo de amostragem são:

seõçatona reV
1. Não se utiliza o conhecimento do pesquisador sobre a população.

2. Os erros de amostragem podem ser maiores quando comparados a outros


métodos.

3. Se lidamos com uma população mais dispersa, os custos de coleta de dados


podem ser maiores do que o esperado.

Além da amostragem aleatória simples, há outros tipos de amostragem


probabilísticas: amostragem sistemática, que, diferente da amostragem simples,
dividimos a população em grupos e em cada grupo trabalhamos com a
amostragem aleatória simples; amostragem estratificada, que consiste em,
basicamente, dividir a população em grupos e subgrupos de acordo com as
características de interesse; e, por fim, amostragem por conglomerados, que
consiste em selecionar primeiramente o grupo e não o indivíduo, como nos outros
tipos de amostragem. Independentemente do tipo de amostragem probabilística, o
objetivo é sempre obter uma amostra representativa. 

Por outro lado, porém, a obtenção de uma amostra verdadeiramente aleatória vai
depender muito da situação da população de interesse. Frequentemente, não é
possível obter uma amostra aleatória, pois, muitas vezes, não há recursos de
pesquisa suficientes para utilizar tal técnica. Por exemplo, se temos por interesse
tratar uma doença (como a Covid-19) em seres humanos através de um dado
medicamento, então os seres humanos que formam a amostra são os acessíveis
em hospitais, visto que não há como saber quem está com a doença fora do
hospital. Isso nos leva ao conceito de amostragem não probabilística, que, em

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/14
04/08/22, 09:25 lddkls221_met_mat

geral, é feita por conveniência devido a recursos disponíveis ou até mesmo não
tem necessariamente um critério para a amostragem. Dentre esse tipo de
amostragem, destacam-se dois tipos principais: julgamento e cotas. 

0
A amostragem por julgamento é simplesmente feita pelo julgamento do próprio
pesquisador em que ele irá buscar por indivíduos com características definidas

seõçatona reV
anteriormente para a sua amostra. Já a amostragem por cotas é o tipo de
amostragem utilizado para pesquisa de mercado, pesquisa eleitoral e opinião
pública. Para se trabalhar com esse tipo de amostragem, devemos determinar as
características gerais de estudo e fazer os questionários; a partir disso, faz-se um
filtro das características mais importantes e tem-se a amostra. A grande
desvantagem desses tipos de amostragem é a chance de se obter viés na pesquisa
ou resultados tendenciosos ou, ainda, inválidos.

Além disso, o objetivo pelo qual selecionamos uma amostra é, necessariamente,


para calcular as estimativas de parâmetros da população (μ, σ 2
, π,  μ d ), fazer
afirmações sobre eles e, talvez, trazer informações sobre a distribuição dos dados.
Os valores da estatística, calculados nas amostras, formam uma “nova população”,
cuja distribuição recebe o nome de distribuição amostral, que são definidas como:

x 1 ,   … ,  x k
¯
¯ 1.  é denominado de distribuição amostral das médias.

2. p 1,   … ,  p k  é denominado de distribuição amostral das proporções.

3. s 2
1
,   … ,  s
2
k
 é denominado de distribuição amostral das variâncias.

¯
¯
x d1 ,   … , x dk 4.  é denominado de distribuição amostral das diferenças de média.

Vamos entender na prática como funciona tais distribuições amostrais, em


particular da média. Para isso, vamos considerar uma população de 4 animais com
68 kg; 80 kg; 84 kg e 87 kg cada animal e que um zootecnista deseja estimar o peso
médio dos animais (μ). Com o objetivo de avaliar a média populacional (μ = 79,75
kg), o zootecnista decide tomar uma amostra aleatória com tamanho 2 e reposição
do animal. Assim, temos então que calcular todas as amostras que são possíveis de
se obter com n  =  2, a fim de calcular a média (x) dessas amostras. No caso desse

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/14
04/08/22, 09:25 lddkls221_met_mat

exemplo, temos 16 pares de animais para calcular a média e obtemos assim 16


médias. Os valores da média, variância e desvio-padrão assumindo a distribuição
amostral das médias são dados, respectivamente, por:

0
¯ 74,0 + 76,0 + 77,5 +… + 87,0
μ
¯    = = 79,75kg
X 16

seõçatona reV
2 2
σ   = 26,09(kg)
¯
X

σ
¯ =  5,11kg
X

Observamos que o valor encontrado para a média, neste caso, da distribuição


amostral das médias é o mesmo valor encontrado para a média da população (
μ
¯ X
= μ ). Porém, por outro lado, vemos que a variância e o desvio-padrão podem
ser, respectivamente, escritos como:
2 2
2 52,18 σ σ 7,22
σ   = 26,09 =
¯   = σ   = √   =   =  5,11
¯
X 2 n X n √2

Portanto, você já sabe como encontramos dois dos parâmetros da chamada


distribuição amostral da média. O próximo passo, por exemplo, seria determinar
qual modelo probabilístico poderia ser utilizado para trabalhar com tal
distribuição. Nesse caso, se aumentarmos o tamanho das amostras de 2 para 3, as
médias amostrais ficam mais concentradas em torno da média verdadeira (μ),
porque o desvio-padrão diminui. Esse conceito define o que chamamos de
Teorema do Limite Central, que encerra a nossa seção dos conceitos iniciais de
probabilidade.

ASSIMILE

Teorema do Limite Central: para as amostras X 1, … ,  X n

independentes e identicamente distribuídas, a distribuição amostral da


média:
X 1 +…+X n
¯
X =
n

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/14
04/08/22, 09:25 lddkls221_met_mat

tem distribuição normal, N (μ, . Isto é, a média da distribuição


2
σ
)
n

amostral das médias é descrita pela média populacional e a variância é


descrita pela variância da população dividida pelo tamanho da amostra.

0
Chegamos então ao fim de nossa seção sobre alguns conceitos básicos de

seõçatona reV
Estatística que irão, no futuro, orientar sua equipe no trabalho e para resolver
problemas relativos à modelagem que envolva análise estatística.

FAÇA VALER A PENA


Questão 1
Quando falamos de Estatística, algo que precisa estar bem definido é o nosso
desenho de estudo e, independente da área de atuação, esse desenho de estudo
deve fazer sentido. Dentre os elementos do desenho de um estudo, dois deles são
fundamentais: população e amostra.

Com base nesses conceitos, assinale a alternativa correta.

a.  Uma população pode ser definida como um grupo de indivíduos que possuem características iguais,
enquanto uma amostra pode ser definida como parte de uma população.

b.  Uma população pode ser definida como um grupo de indivíduos que possuem características diferentes,
enquanto uma amostra pode ser definida como complemento de uma população.

c.  Uma população pode ser definida como um grupo de indivíduos que possuem características iguais,
enquanto uma amostra pode ser definida como complemento de uma população.

d.  Uma população pode ser definida como um grupo de indivíduos que possuem características diferentes,
enquanto uma amostra pode ser definida como parte de uma população.

e.  Uma população pode ser definida como um grupo de indivíduos que possuem características diferentes,
que formam um subconjunto de amostra que contém todos os tipos de indivíduos.  

Questão 2
Suponha que você tenha que coletar amostras de um determinado rio. Sabendo
que se pode ter 10 tipos de amostras (A, B, C, D, E, F, G, H, I, K), foi solicitado a você
escolher uma amostra ao acaso. Qual a probabilidade de a amostra escolhida ser
uma amostra descrita por uma vogal?

Assinale a alternativa correta


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/14
04/08/22, 09:25 lddkls221_met_mat

Assinale a alternativa correta.

a.  9/10

b.  2/10

0
c.  3/10

seõçatona reV
d.  5/10 

e.  6/10 

Questão 3
Dentre os tipos de amostragem, a mais famosa é a amostragem aleatória simples,
que é uma técnica em que todos os indivíduos de uma dada população têm a
mesma probabilidade de serem selecionados para a amostra. Esse tipo de
amostragem tem certos tipos de vantagens, porém também tem suas
desvantagens.

A respeito dessas vantagens e desvantagens, assinale a alternativa correta.

a.  A principal vantagem desse tipo de amostragem é não utilizar o conhecimento do pesquisador sobre o
tema, e a principal desvantagem é que a probabilidade de seleção de um indivíduo é a mesma para todos os
indivíduos.

b.  A principal vantagem desse tipo de amostragem é utilizar o conhecimento do pesquisador sobre o tema,
e a principal desvantagem é a probabilidade de seleção de um indivíduo não ser a mesma para todos os
indivíduos.

c.  A principal vantagem desse tipo de amostragem é não utilizar o conhecimento do pesquisador sobre o
tema, e a principal desvantagem é a probabilidade de seleção de um indivíduo não ser a mesma para todos
os indivíduos. 

d.  A principal vantagem desse tipo de amostragem é a probabilidade de seleção de um indivíduo não ser a
mesma para todos os indivíduos, e a principal desvantagem é não utilizar o conhecimento do pesquisador
sobre o tema. 

e.  A principal vantagem desse tipo de amostragem é a probabilidade de seleção de um indivíduo ser a
mesma para todos os indivíduos, e a principal desvantagem é não utilizar o conhecimento do pesquisador
sobre o tema.  

REFERÊNCIAS
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. São
Paulo: Editora da Universidade de São Paulo, 2002.
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 13/14
04/08/22, 09:25 lddkls221_met_mat

NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.

SOUZA, D. V. et al. Introdução ao R: Aplicações Florestais. Curitiba: Ed. do Autor,


2018. Disponível em:

0
https://www.researchgate.net/publication/342052263_Introducao_ao_Aplicacoes_Fl
orestais. Acesso em: 24 jun. 2021.

seõçatona reV
THE R Project for Statistical Computing. Disponível em: https://www.r-project.org.
Acesso em: 12 abr. 2021.

VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 14/14
04/08/22, 09:26 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


INTRODUÇÃO À PROBABILIDADE E ESTATÍSTICA

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Em primeiro lugar, você deve mapear a área para saber exatamente com quantos
rios você lidará para realizar a amostragem. Dado que você deve ter a mesma
probabilidade de escolha para cada um dos rios, então, naturalmente, você irá
considerar um plano de amostragem baseado em amostragem aleatória simples.
Sua população-alvo são os rios, e devido aos seus recursos, você não pode ter uma
amostra muito grande. O segundo passo é fazer a proporção de instrumentos e
pessoas para a coleta da amostra após a seleção aleatória de uma quantidade
amostral dos rios, visto que não há recursos para se trabalhar com todos. Definida
essa proporção, com base na extensão dos rios selecionados, você fará o cálculo
das probabilidades a fim de determinar o tamanho da amostra necessária para
fazer análises estatísticas sobre a população de rios considerada. Embora não seja
seu melhor plano de amostragem (a amostragem simples), é a melhor maneira de
usar com mais eficiência os recursos disponíveis. Após escrever o plano, você ainda
pode se reunir com o prefeito e sugerir uma amostragem por estratificação, em
que os estratos são as regiões em que se localizam os rios.

AVANÇANDO NA PRÁTICA

GERMINAÇÃO DE SEMENTES

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:26 lddkls221_met_mat

Em um experimento genético, você foi convidado a trabalhar com Engenharia


Genética, a fim de lidar com a germinação de sementes. Um dado experimento
aleatório foi realizado diversas vezes para saber se uma determinada planta
geneticamente modificada iria ou não germinar suas sementes. Nesse aspecto,

0
você deve calcular a probabilidade de germinação sob três óticas: frequentista,

seõçatona reV
clássica e subjetiva, uma vez que essas óticas podem lhe trazer uma visão melhor
do que está acontecendo, de fato, no experimento. Como você faria tais cálculos
supondo que foram realizados 100 vezes o experimento e em 50 deles as
sementes germinaram?

RESOLUÇÃO 

No geral, a germinação de uma semente só tem dois resultados: germina ou


não germina. Seja A o evento relacionado com “a semente germinou”. Então,
após as 100 realizações do experimento, sob a ótica frequentista, a
probabilidade de germinação da semente é dada por:
nA 50 1
P (A) =  lim n→∞ n
= =
100 2

Que nos diz que essa probabilidade é de 50%. Por outro lado, sob o ponto de
vista clássico, tal probabilidade é dada por:
N (A) 50
P (A) = =
N (Ω) 100

Que também nos dá 50% de probabilidade. Por fim, sob o ponto de vista
subjetivo, pode-se implicar duas coisas. A primeira é que nos foi afirmado que
metade germinou, logo a probabilidade de germinação é, de fato, 50%. A
segunda é que podemos pensar que, a cada falha, uma semente germinava. E
como foram realizados 100 experimentos, então obtivemos 50 sucessos, isto é,
50% das chances. Embora as interpretações sejam diferentes, chegamos ao
mesmo resultado. Então, no seu relatório final, você pode dizer que,
independentemente da abordagem, a probabilidade de as sementes
germinarem é de 50%.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:26 lddkls221_met_mat

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:26 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

MEDIDAS DE TENDÊNCIA CENTRAL E DE DISPERSÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
PRATICAR PARA APRENDER
Caro aluno, nesta seção iremos entender o conceito das medidas de tendência
central ou posição e também as medidas de dispersão. Tais medidas são
fundamentais para você compreender a importância delas nos trabalhos
científicos e no dia a dia de sua profissão.

Como exemplo dessa abordagem, podemos considerar uma experimentação de


tratamento de poluição hídrica em lago de uma determinada comunidade em que
a pesca é o principal recurso de sobrevivência das pessoas daquela região. Como
um dos objetivos, você precisa calcular, por exemplo, a concentração média de um
determinado composto para fazer o tratamento da água desse lago e também
trabalhar com a dispersão dos poluentes nesse lago. Percebe o quanto essas
medidas nos trazem informações importantes? 

Atualmente, com o crescimento do uso de ferramentas estatísticas, matemáticas e


computacionais em análise de dados, nenhuma empresa quer ficar para trás.
Nesse aspecto, suponha que você foi contratado por uma empresa para avaliar as
concentrações de pH de um determinado rio em que se cria peixes para pesquisa.
O valor do pH é uma medida do grau de acidez ou alcalinidade da água, sendo 7 o
valor neutro do pH. Sabe-se que em certos ecossistemas, como o de peixes,
valores de pH muito baixos ou muito altos podem ser letais para a grande maioria
das espécies. Então, a empresa deseja que isso não aconteça com sua criação de
peixes. Logo, uma amostragem de valores de pH de dois anos foi realizada nessa

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/13
04/08/22, 09:26 lddkls221_met_mat

empresa com a finalidade de trazer algumas informações sobre tais


concentrações, como média, variância, máximo e mínimo, para se ter um devido
controle da produção de peixes. Os dados amostrados são:

0
Tabela 3.1 | Concentrações de pH fornecidas pela empresa

seõçatona reV
Mês Período

1º Ano 2º Ano

Janeiro 8,12 2,97

Fevereiro 8,10 8,12

Março 8,18 3,08

Abril 7,94 8,11

Maio 8,23 8,11

Junho 1,98 3,97

Julho 8,16 8,21

Agosto 2,10 8,06

Setembro 7,88 8,21

Outubro 3,03 3,01

Novembro 5,09 11,86

Dezembro 8,06 10,10

Fonte: elaborada pelo autor.

Como você faria o cálculo da média, da variância, do máximo e do mínimo em cada


ano? Como apresentaria tais resultados para empresa?

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/13
04/08/22, 09:26 lddkls221_met_mat

Vamos então começar o entendimento dessas medidas? Você será acompanhado


em todo o processo! Iniciaremos com as medidas de tendência central, como
média, mediana e moda, e depois passaremos para as medidas de dispersão,
como variância, desvio-padrão e coeficiente de variação. 

0
seõçatona reV
CONCEITO-CHAVE
Em situações práticas, no geral, descrevemos os dados por quantidades,
denominadas medidas resumo, que resumem todos os dados do conjunto bruto
de dados. Por exemplo, em uma fazenda podemos estar interessados em um valor
que descreve o mais típico tipo de árvore; ou o número de árvores presente em
25% da fazenda. Tais medidas são denominadas medidas de tendência central (de
posição).

No geral, as medidas de tendência central podem ser definidas como “valor


numérico central de uma distribuição de valores” (MAGALHÃES, 2002). Dentre
essas medidas, as mais importantes são: média aritmética, mediana, moda e
percentis. Antes de prosseguir com as medidas de posição, dois conceitos devem
estar bem definidos: população e amostra. Tais conceitos já vimos na seção
anterior, mas vamos retomá-los aqui. 

População: uma população pode ser definida como um grupo de indivíduos que
possuem característica(s) em comum.

Amostra: uma amostra é, basicamente, um “pedaço” da população da qual temos


por objetivo estudar para inferir resultados sobre a população. Naturalmente, há
diversas formas de selecionar uma amostra, porém, em muitos casos, depende
exclusivamente dos recursos disponíveis para a coleta dos dados.

ASSIMILE

É importante destacar que em grande parte dos estudos trabalhamos com


a amostra para realizar inferências sobre a população quando ela é inviável
de se trabalhar (quantidade de dados exuberantes).

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/13
04/08/22, 09:26 lddkls221_met_mat

Bom, vamos então dar início ao nosso conteúdo. Iniciaremos com a primeira
medida de posição: a média aritmética. Tal medida é a de posição mais popular
que temos e trabalhamos em muitos estudos. Ela pode ser calculada em duas
situações: amostra e população.

0
Média populacional: a média populacional é simplesmente calculada somando-se

seõçatona reV
todos os valores obtidos para população e dividindo o resultado pelo total de
elementos da população (MAGALHÃES, 2002). Em outras palavras, a média
populacional é dada por:
x 1 + …+ x N
μ =
N

em que N é o tamanho da população e x i,  i  =  1,  … ,  n são os elementos da


população. É importante destacar que média populacional é sempre denotada por
uma letra grega (no caso, μ) a qual representa um parâmetro em estatística.

Média amostral: diferente da média populacional, a média amostral trabalha


exclusivamente com elementos da amostra (MAGALHÃES, 2002). Nesses termos, a
média amostral é dada por:
x 1 + …+ x n
¯
x =
n

em que n é o tamanho da amostra e x i,  i  =  1,  … ,  n são as observações da


amostra. É importante destacar que a média amostral, diferente da populacional, é
sempre denotada por uma letra minúscula do alfabeto tradicional (no caso, x).

EXEMPLIFICANDO

Suponha que nosso objetivo seja avaliar o número médio de amostras


contaminadas de água em uma dada população de lagos. Se o número de
amostras contaminadas em um certo ano em cinco lagos é: 42, 43, 36, 32 e
40, o que podemos afirmar a respeito do número médio de amostras
contaminadas para uma população de 100 lagos? Nesse caso, temos que 
n  =  5 e a média dessa amostra é dada por:
x 1 + …+ x n 42 + 43 + 36 + 32 + 40
x =
¯ = = 38,6
n 5

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/13
04/08/22, 09:26 lddkls221_met_mat

Supondo que os dados constituem uma amostra no sentido técnico (isto é,


um conjunto de dados do qual podemos tirar generalizações válidas),
podemos estimar (hipoteticamente) que o número médio de amostras
contaminadas dos 100 lagos é de μ  =  38,6 amostras contaminadas.

0
seõçatona reV
Em termos de simplificação de notação, iremos fazer o uso da notação ∑ n

i
xi  

para denotar a soma das n observações da amostra ou população. Nesse caso, a


média amostral pode ser reescrita como:
n
∑ xi
i
¯
x =
n

Algumas observações importantes sobre a média:

1. A média existe para qualquer conjunto de dados de natureza numérica.

2. A média é sempre única.

3. A média é útil para outras avaliações estatísticas, como a média global de um


conjunto de dados.

4. A média é sensível a pontos extremos, isto é, os pontos extremos de uma


amostra interferem na representatividade da média para aquela amostra.

5. A média leva em conta todos os dados.

Em algumas situações práticas, os dados podem ser apresentados em tabelas de


frequências por ponto ou classes. Nesse caso, a média tradicional não pode ser
diretamente calculada, uma vez que os dados estão agrupados ou possuem pesos
diferentes. Assim, fazemos uma modificação para o cálculo da média, que passa a
ser chamada de média ponderada.

ASSIMILE

¯
xp Média ponderada: A média aritmética ponderada  de uma amostra 
x 1 ,  x 2 ,   … ,  x n com frequência absoluta f 1,  f 2 ,   … ,  f n é dada por:
n
∑ x i  f i
i = 1
xp =
¯ n
∑ fi  
i = 1

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/13
04/08/22, 09:26 lddkls221_met_mat

em que x i =
I i  + L i

2
para uma tabela de frequência que divida em classes (
Ii  é dito limite inferior da classe e L é dito limite superior da classe).
i

EXEMPLIFICANDO

0
Considere a tabela a seguir com a distribuição do número de testes

seõçatona reV
hidráulicos diários realizados por 79 engenheiros a respeito de uma
avalição da instalação hidráulica de um determinado veículo.

Tabela 3.2 | Número de testes hidráulicos realizados por 79 engenheiros a respeito de uma
instalação hidráulica

Número de testes Número de engenheiros %

5 3 3,8

10 23 29,1

15 43 54,4

20 10 12,7

Total 79 100

Fonte: elaborada pelo autor.

Nesse caso, inicialmente, determinamos a variável resposta (ou de


interesse), que aqui é o número de análises, e reescrevemos a tabela
anterior como:

Tabela 3.3 | Tabela de frequência do número de testes hidráulicos realizados por 79


engenheiros a respeito de uma instalação hidráulica

Número de testes (x )  i
Número de engenheiros (f ) i % xi fi

5 3 3,8 15

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/13
04/08/22, 09:26 lddkls221_met_mat

Número de testes (x )  i
Número de engenheiros (f ) i % xi fi

10 23 29,1 230

0
15 43 54,4 645

seõçatona reV
20 10 12,7 200

Total 79 100 1090

Fonte: elaborada pelo autor.

Assim, a média ponderada dessa amostra é dada por:


15 + 230 + 645 + 200
¯
xp = =  13,8
79

Com isso, encerramos as duas formas de se calcular a média de um conjunto de


dados. Mas você se lembra de que a média é uma medida sensível? Então, nesse
caso, precisamos de outra medida que não seja sensível a pontos extremos. Tal
medida é conhecida como mediana. 

Mediana: é definida como a observação central se o número de elementos na


amostra for ímpar, e será a média aritmética dos dois elementos centrais caso o
número de observações na amostra seja par. Denotamos mediana de uma
amostra x 1,   … ,  x n por  x̃.

REFLITA

Considere o pH de 7 amostras de efluentes industriais de uma determinada


empresa: 1, 1, 2, 3, 3, 10, 12. Qual medida representa melhor esse conjunto
de dados? Média ou mediana?

Certo, vimos como a mediana funciona. Mas será que existe outra medida de
posição que se faz importante? Sim, a moda. Essa medida desempenha um papel
fundamental em estudos ambientais quando o intuito, por exemplo, é saber qual

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/13
04/08/22, 09:26 lddkls221_met_mat

espécie de árvore é mais frequente em uma determinada região; a raça mais


abundante de peixe em uma represa; predador mais comum em determinados
ecossistemas; entre outras aplicações.

0
Moda: é a medida representada pelo valor na amostra que ocorre com maior
frequência. A moda não é única, uma vez que podemos ter empate de frequências.

seõçatona reV
A rigor de notação, denotamos moda por x . m

Para complementar uma boa análise das estatísticas descritivas de uma amostra,
além das medidas de posição citadas anteriormente, necessitamos de mais
algumas medidas de posição que se fazem importantes: máximo, mínimo e quartil.
Essas medidas são fundamentais para algumas técnicas gráficas como o boxplot.

Máximo e mínimo: o mínimo é definido como sendo a menor observação da


amostra; já o máximo é definido como sendo a maior observação da amostra.

Quartil: medida que divide o conjunto de dados em basicamente quatro partes


iguais, com os dados em ordem crescente. O primeiro quartil, Q1, representa 25%
das observações; Q2 representa a mediana que corresponde a 50% das
observações; e Q3, representa 75% das observações do banco de dados.

Assim, encerramos nosso conteúdo sobre medidas de posição. Agora, vamos a um


pequeno exemplo: considere que uma indústria A tem três tipos de maquinários
com o número de falhas dessas máquinas descritos por 72, 76 e 74, enquanto uma
indústria B tem os mesmos três tipos de máquinas com o número de falhas de
cada máquina dado por 72, 91 e 59. Note que o número médio de falhas de cada
máquina de cada indústria é o mesmo, 74, mas observe a diferença de
variabilidade. Isto é, enquanto a indústria A tem uma quantidade de falhas
equivalente para cada máquina, na indústria B há uma falha muito maior na
segunda máquina. Perceba que, nesse caso, a medida de posição “média” é
insuficiente para descrever, por exemplo, a homogeneidade das falhas das
máquinas. Nesse caso, devemos trabalhar com o que chamamos de medidas de
dispersão, que têm por objetivo medir a variação ou dispersão do nosso conjunto
de dados. 
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/13
04/08/22, 09:26 lddkls221_met_mat

A primeira medida que vamos trabalhar é a amplitude. Tal medida é usada,


preferencialmente, no controle de qualidade industrial para manter o controle
imediato de matérias-primas e produtos. Há dois tipos de amplitudes: geral
(abrange todos os valores da amostra) e interquartil (abrange mais ou menos 50%

0
dos dados centrais).

seõçatona reV
Amplitude geral: dado o conjunto de dados ordenado: 
X (1) ≤ X (2) ≤ … ≤ X (n) , a amplitude geral R dos dados é dada por: 
R = X (n) − X (1) .

Amplitude interquartil: a amplitude interquartil R dos dados é dada por:  Q

R = Q3 − Q1 .

A amplitude geral não é uma medida muito útil da variação dos dados, uma vez
que ela não nos diz coisa alguma sobre a dispersão dos valores entre os dois
extremos. Considere os três conjuntos de concentração de um determinado
efluente a seguir:

  Conjunto A: 5, 18, 18, 18, 18, 18, 18, 18, 18, 18

  Conjunto B: 5, 5, 5, 5, 5, 18, 18, 18, 18, 18

  Conjunto C: 5, 6, 8, 9, 10, 12, 14, 15, 17, 18

Note que a amplitude de cada um dos conjuntos é a mesma e igual a 13, mas suas
dispersões entre o primeiro e o último valor são totalmente diferentes. Assim,
necessitamos de uma nova medida para lidar com esses dados, que é a variância.

A segunda medida de dispersão que vamos trabalhar é a variância. Essa medida


trabalha com a dispersão dos dados ao redor da média e pode ser calculada tanto
para a população quanto para a amostra. Isto é:

Variância populacional: dada uma população x 1 ,...,x N de N elementos, a


variância, nesse caso, é dada por (MAGALHÃES, 2002):
2
2 n (x i −μ)
σ   = ∑  
i = 1 N

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/13
04/08/22, 09:26 lddkls221_met_mat

Variância amostral: dada uma amostra x 1, … , xn de n elementos, a variância,


nesse caso, é dada por (MAGALHÃES, 2002):
2
¯
2 n (x i −x)
s   = ∑  
i = 1 n−1

0
ASSIMILE

seõçatona reV
É importante fixar que ao trabalhar com a variância amostral, iremos
perder 1 grau de liberdade quando comparada à variância populacional
devido ao uso da média amostral como estimador.

EXEMPLIFICANDO

Voltando ao nosso exemplo da água contaminada em lagos. Vamos supor


que nosso objetivo agora seja avaliar a variância em vez da média. Se o
número de amostras contaminadas em cinco lagos é: 42, 43, 36, 32 e 40, o
que podemos concluir sobre a variância de amostras contaminadas para
uma população de 100 lagos? Nesse caso, temos que n = 5 e a média dessa
amostra é 38,6 amostras contaminadas. Portanto, a variância é dada por:
2
¯
2 n (x i −x)
s   = ∑
i = 1 n

2 2 2 2 2
(42 − 38,6) + (43 − 38,6) + (36 − 38,6) + (32 − 38,6) + (40 − 38,6)
=
5

= 20,8

Supondo que os dados constituem necessariamente uma amostra no


sentido técnico (isto é, um conjunto de dados do qual podemos tirar
generalizações válidas), podemos estimar (hipoteticamente) que a variância
populacional de amostras contaminadas dos 100 lagos é de σ 2
= 20,8

amostras contaminadas.

Depois da variância, uma outra medida de dispersão de suma importância é o


desvio-padrão que trabalha o “erro” de estimação. Nesse caso, temos que:

Desvio-padrão populacional: é uma medida de dispersão dada pela equação:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/13
04/08/22, 09:26 lddkls221_met_mat

2
n (x i −μ)

σ  = ∑
i = 1 N

Desvio-padrão amostral: é uma medida de dispersão dada pela equação:


2
¯
n (x i −x)
s  = √ ∑

0
i = 1 n−1

De acordo com a definição de desvio-padrão, observamos que a dispersão de um

seõçatona reV
conjunto de dados se baseia nas disposições dos dados em torno da média, isto é,
quanto mais “afastados” da média, mais disperso é o conjunto de dados. Esse
conceito nos leva ao último conceito de nossa seção: o Teorema de Tchebichev e o
coeficiente de variação.

Teorema de Tchebichev: Em qualquer conjunto de dados, dado uma constante 


k  >  1 , a proporção dos dados que devem estar a menos de k desvios-padrão de
qualquer um dos lados da média é pelo menos 1  − k
1
2
(MAGALHÃES, 2002).

Para finalizar, podemos definir o coeficiente de variação, que é uma das medidas
utilizadas quando nosso interesse é analisar a dispersão em termos relativos a seu
valor médio, mas sem levar em conta a influência da ordem de grandeza da
variável. Tal medida é definida como:
s
CV =

É importante salientar que o coeficiente de variação está entre 0 e 1, mas pode ser
escrito também em porcentagem, multiplicando-se o valor do CV por 100. E com
isso encerramos nossa seção sobre medidas de dispersão e tendência central.
Deixo também como encerramento a questão: onde podemos utilizar o Teorema
de Tchebichev?

FAÇA VALER A PENA


Questão 1
Em estatística descritiva, as medidas de tendência central são de suma importância
para resumir nosso conjunto de dados. No entanto, algumas dessas medidas
podem ser sensíveis a valores extremos, como a média.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/13
04/08/22, 09:26 lddkls221_met_mat

Com base na definição dessas medidas, assinale a alternativa correta.

a.  Em casos que a média se torna sensível para representar determinado conjunto de dados, fazemos o uso
da mediana por esta ser mais representativa, uma vez que não é sensível a valores extremos.

b.  Em casos que a média se torna sensível para representar determinado conjunto de dados, fazemos o uso

0
da moda por esta ser mais representativa, uma vez que não é sensível a valores extremos.

seõçatona reV
c.  Em casos que a média se torna sensível para representar determinado conjunto de dados, fazemos o uso
do quartil por este ser mais representativo, uma vez que não é sensível a valores extremos.

d.  Em casos que a média se torna sensível para representar determinado conjunto de dados, fazemos o uso
do mínimo por este ser mais representativo, uma vez que não é sensível a valores extremos.

e.  Em casos que a média se torna sensível para representar determinado conjunto de dados, fazemos o uso
do máximo por este ser mais representativo, uma vez que não é sensível a valores extremos.

Questão 2
suponha que você tenha que estimar a concentração média de nitrogênio líquido
para refrigerar um sistema industrial. Foi lhe fornecida a seguinte amostra de
concentrações de nitrogênio líquido: 15, 14.1, 17.2, 20, 10.2, 28.2, 30.

Com base nessa amostra, assinale a alternativa que contém o valor da


concentração média.

a.  12.01 

b.  15.22

c.  20.81

d.  17.32

e.  19.24 

Questão 3
Suponha que você precise calcular a variância de uma amostra de ferro de um
certo ferro-velho para saber a variabilidade aproximada da distribuição dos pesos
de ferro. Para seu estudo, foi considerada a seguinte amostra de pesos de ferro
em toneladas: 15, 14.1, 17.2, 20, 10.2, 28.2, 30, 50, 32.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/13
04/08/22, 09:26 lddkls221_met_mat

Com base nessa amostra, assinale a alternativa que contém o valor da variância
dos pesos de ferro.

a.  160.23

0
b.  142.23

seõçatona reV
c.  153.16

d.  167.13

e.  114.12 

REFERÊNCIAS
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. São
Paulo: Editora da Universidade de São Paulo, 2002.

MASIERO, P. C. Introdução à análise de dados ESE. In: Notas de aula, 2017.


Disponível em:
https://edisciplinas.usp.br/pluginfile.php/3371051/mod_resource/content/1/Aula_5
_Analise_Dados_ESExp_2017.pdf. Acesso em: 12 abr. 2021.

NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.

THE R Project for Statistical Computing. Disponível em: https://www.r-project.org.


Acesso em: 12 abr. 2021.

VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 13/13
04/08/22, 09:26 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


MEDIDAS DE TENDÊNCIA CENTRAL E DE DISPERSÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
No contexto apresentado e para a amostra considerada, podemos calcular a média
e a variância por meio das expressões dadas, respectivamente, por:
1 n
¯
X = ∑ x i (m dia amostral)
n i=1
é

e
1 n 2
¯
s = ∑
2
(x i − x) (vari ncia amostral)
n−1 i=1
â

Logo, para o 1º ano, obtemos que a média é, aproximadamente, igual a 6,41 e a


variância é, aproximadamente, 6,72. Já para o 2º ano, temos que a média é,
aproximadamente, 6,98 e a variância é, aproximadamente 8,88. Agora, o máximo e
o mínimo são medidas relativas ao maior e menor falar dos dados observados em
cada ano. Nesse caso, no 1º ano, o máximo é 8,23 e o mínimo é 1,98. Já no 2º ano,
o máximo é 8,23 e o mínimo é 2,97. Agora, para apresentar a empresa, montamos
a seguinte tabela:

Tabela 3.2 | Resultados descritivos sobre o pH da amostra considerada

Medida Ano

1º 2º

Média 6,41 6,98

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:26 lddkls221_met_mat

Medida Ano

Variância 6,72 8,88

0
Máximo 8,23 11,86

seõçatona reV
Mínimo 1,98 2,97

Fonte: elaborada pelo autor.

De acordo com essa tabela, chegamos à conclusão de que a média de pH no


primeiro ano é de 6,41, que não é letal para os peixes, porém houve período em
que o pH mínimo foi de 1,98 nesse ano (junho), que pode ter sido letal para os
peixes. A variabilidade do pH foi de 6,72 de acordo com o valor da variância. Já
para o segundo ano, a média de pH é de 6,98, que não é letal para os peixes,
porém houve período em que o pH mínimo foi de 2,97 nesse ano (janeiro), que
pode ter sido letal para os peixes. A variabilidade do pH foi de 8,88 de acordo com
o valor da variância.

AVANÇANDO NA PRÁTICA

MÉDIA DE CONCENTRAÇÕES DE GASES POLUENTES


Em uma determinada pesquisa sobre poluição, você foi solicitado para auxiliar o
pesquisador-chefe em uma determinada análise estatística sobre concentrações
de gases poluentes. O pesquisador lhe mostrou a amostra de concentração de
CO2, que consistiu nos valores 15, 10, 12, 11, 15, 20, 25, 30, 10, 12 e 12 mg/L. Em
seu estudo, ele precisa calcular a concentração média para avaliar se está dentro
do padrão e a variância para entender a variabilidade da concentração. Como você
faria esses cálculos e apresentaria ao pesquisador?

RESOLUÇÃO 

No contexto apresentado e para a amostra considerada, podemos calcular a


média e a variância por meio das expressões dadas, respectivamente, por:
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:26 lddkls221_met_mat

n
¯
X =
1
∑ x i (m dia amostral)
n i=1
é

0
n 2
¯
s = ∑ (x i − x) (vari ncia amostral)
2
n−1
1
i=1
â

seõçatona reV
Logo, temos que a média é, aproximadamente, 15,64 e a variância é,
aproximadamente, 43,85. Isto é, a concentração média de CO  nesse estudo é 2

de, aproximadamente, 15,64 mg/L, que está um pouco alta para os padrões. Já
a variabilidade gira em torno de 43,85 mg/L², que nos mostra uma dispersão
muito grande dos valores de concentração de CO . Talvez sejam necessárias 2

mais informações sobre a concentração para uma análise mais concisa.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:27 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

REGRESSÃO LINEAR E CORRELAÇÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
PRATICAR PARA APRENDER
Caro aluno, nesta seção iremos entender os conceitos de dispersão, correlação e
regressão. Com esses conceitos em mente, você entenderá que boa parte dos
resultados é baseada nesses conceitos. Como exemplo dessa abordagem, você
pode considerar um estudo que deseja avaliar a resistência de uma viga de acordo
com o tipo de material. Para atingir tal objetivo, você irá trabalhar com o que
chamamos de modelo de regressão, que lhe trará todas as conclusões necessárias
a respeito do seu experimento com as vigas, permitindo um melhor entendimento
e a interpretação do experimento em questão. 

Suponha que você, um engenheiro ambiental com especialidade em poluição


atmosférica, decida trabalhar com análise da qualidade do ar. Como você ainda
está iniciando nessa área, decidiu utilizar um banco de dados de prática chamado
“airquality” do software R, cujas primeiras linhas são:

Ozone Solar.R Wind Temp Month Day

1  41   190 7.4  67   5  1

2  36   118 8.0  72   5  2

3  12   149 12.6  74   5  3

4  18   313 11.5  62   5  4

5  NA   NA 14.3  56   5  5

6  28   NA 14.9  66   5  6

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/12
04/08/22, 09:27 lddkls221_met_mat

Para trabalhar com esses dados, você necessita de um modelo de regressão.


Assumindo que a variável resposta, Y, seja a concentração de ôzonio, qual modelo
de regressão você montaria? Como você estima os parâmetros desse modelo? E as
interpretações desses parâmetros, como faria?

0
Que tal começar esse entendimento agora? Você será acompanhado em todo o

seõçatona reV
processo! Iniciaremos com os conceitos de dispersão e correlação, que são
necessários para a construção do modelo de regressão, objetivo principal desta
seção!

CONCEITO-CHAVE
Você já parou para pensar em como podemos visualizar a relação entre dados?
Não? Ora, para isso, podemos utilizar diagramas de dispersão. Mas o que é um
diagrama de dispersão? Podemos dizer que diagrama ou gráfico de dispersão é
uma ferramenta estatística que indica a existência, ou não, de relações entre
variáveis. Em geral, esse tipo de gráfico é utilizado quando desejamos saber o que
acontece com uma variável quando a outra se altera, como uma espécie de causa
e efeito.

Por exemplo, um engenheiro mecânico deseja avaliar o consumo de combustível


(milhas por galão) de carros de acordo com o tipo de transmissão (automática ou
manual). Em geral, acredita-se que o tipo de transmissão causa um maior consumo
de combustível, especialmente se o carro for automático. Mas será que isso é
verdade? Vamos verificar o diagrama de dispersão (Figura 3.1) para ver o que
acontece.

Figura 3.1 | Diagrama de dispersão do consumo de combustível de acordo com o tipo de transmissão
do veículo

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/12
04/08/22, 09:27 lddkls221_met_mat

0
seõçatona reV
Fonte: elaborada pelo autor.

Baseando-se nesse diagrama, podemos observar dois fatos. O primeiro, as milhas


por galão dos carros automáticos parecem estar todas próximas ao mesmo limiar
e menos dispersas quando comparadas aos carros manuais. O segundo fato é que
alguns dos carros manuais analisados parecem tem um consumo duas vezes
menor do que alguns carros automáticos.

Assim, podemos concluir que, sem nenhum tipo de inferência estatística, os carros
manuais parecem ser mais econômicos. É claro que somente o tipo de transmissão
não é suficiente para determinar o consumo, isto é, precisamos de uma análise
mais detalhada para tal. Esse exemplo serve para reforçar que devemos ter muito
cuidado ao analisar informações, dado que muitas delas são necessárias para
chegar a uma conclusão e não apenas um olhar superficial, considerando o
mínimo de informações.

Uma outra medida importante sobre relação entre variáveis é o coeficiente de


correlação. Em 1896, Karl Pearson propôs o tão famoso coeficiente de correlação ρ
(ou produto-momento) de Pearson. Esse coeficiente tem por objetivo estudar a
relação entre duas variáveis e tem como vantagem ser um número puro, isto é,
não tem uma unidade de medida definida.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/12
04/08/22, 09:27 lddkls221_met_mat

Para trabalhar com esse coeficiente, considere x 1,   … ,  x n as observações de


uma variável X (por exemplo, milhas por galão) e y 1,   … ,  y n as observações de
¯
¯
x,  y,  s x sy uma variável Y (por exemplo, cilindradas de um motor). Sendo  e  ,
respectivamente, as médias e os desvios-padrão amostrais de ambas as variáveis,

0
podemos escrever o coeficiente da correlação de Pearson da seguinte forma:

seõçatona reV
s xy
r  =
sx sy

em que
¯
¯
∑ x i  y i  − nxy
s xy =
n − 1

representa a covariância entre X e Y .

Dessa equação, tiramos as duas principais propriedades do coeficiente de


correlação: o sinal e a magnitude. O sinal se relaciona com o tipo de
relacionamento: crescente (sinal positivo) e decrescente (sinal negativo). Quando
se estuda a relação entre duas ou mais variáveis, é importante levar em conta essa
informação, pois ela nos diz, por exemplo, se X está crescendo, então Y está
decrescendo ou crescendo, dependendo do sinal. Por exemplo, considerando
carros, se tivemos um aumento nas cilindradas, espera-se que o veículo gaste mais
combustível e consequentemente fará menos milhas por galão. Mas como
verificamos essa informação? Inicialmente com o coeficiente de correlação.

Por outro lado, a magnitude do coeficiente de correlação varia no intervalo de


(-1,1) e indica, no gráfico de dispersão, um formato visual mais próximo de uma
reta. Por exemplo, valores próximos de -1 indicam uma correlação negativa
perfeita (praticamente uma reta decrescente), e valores próximos de +1 indicam
uma correlação positiva perfeita (praticamente uma reta crescente). Em ambos os
casos, a dispersão dos dados é extremamente baixa, o que é desejável em quase
todos os tipos de análises estatísticas. Além disso, temos o caso em que a
magnitude é igual a 0, que nos indica que não há, no gráfico de dispersão, uma
forma definida e os dados se apresentam mais dispersos mostrando que as
variáveis podem não ter nenhum tipo de relação.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/12
04/08/22, 09:27 lddkls221_met_mat

Certo, entendemos o que é coeficiente de correlação e também o que é gráfico de


dispersão, mas ainda falta um certo conceito que vai nos dar um norte para nosso
objetivo principal dessa seção: o modelo de regressão linear. Mas então, qual é o
conceito restante? Ora, é o que chamamos de coeficiente de determinação R , 2

0
que é simplesmente definido como sendo R 2
= ρ
2
, isto é, o coeficiente de

seõçatona reV
determinação é o quadrado do coeficiente de correlação. Esse coeficiente é útil,
em particular, para explicar a proporção da nossa variável resposta, dada a
variabilidade das outras variáveis, chamadas de preditoras.

Vamos a um exemplo prático de como interpretamos esse coeficiente. Para isso,


suponha que ao avaliar a correlação entre as variáveis Y = “milhas por galão” e X =
“cilindradas do veículo”, obtivemos um valor ρ  =   − 0,079 para o coeficiente de
correção. Nesse caso, a partir da definição do coeficiente de determinação, temos
que R 2
  =  0,62 ou 62%. Mas o que isso quer dizer? Ora, dizemos que cerca de
62% da variabilidade da variável Y é explicada pela variável X, isto é, 62% da
variação de consumo é explicado pelas cilindradas do veículo e vice-versa. Em
geral, procuramos sempre por um coeficiente de determinação superior a 90%
para uma melhor interpretação, porém isso nem sempre é possível, como vimos
nesse exemplo.

ASSIMILE

Esta é uma frase importante que devemos ter em mente: não é porque
duas variáveis estão relacionadas que uma é a causa da outra. Por
exemplo, vamos considerar o número de pessoas que praticam esporte,
tipo corrida, e a quantidade de suplementos esportivos consumidos são
altamente correlacionados. Porém, isso não significa que a prática de
corrida causa necessariamente a compra de suplementos esportivos. Em
geral, é complicado estabelecer relações causais considerando apenas
dados observacionais, é necessário também a realização de experimentos
para essa finalidade.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/12
04/08/22, 09:27 lddkls221_met_mat

Agora temos todas as ferramentas para o prato principal da nossa seção: o modelo
de regressão linear. Mas antes, vamos entender a origem desse modelo. Em um
estudo para trabalhar a relação entre a altura dos pais e dos filhos (X  e Y ), a fim i i

de verificar como a altura do pai influenciava a altura do filho, Galton deu origem,

0
no século XIX, ao que conhecemos hoje como teoria de regressão. O termo

seõçatona reV
regressão veio pelo fato de que no experimento de Galton as medidas estudadas
tendiam a regredir à média. De modo geral, os modelos de regressão têm como
objetivos:

Predição – consiste em predizer valores de Y por meio de valores de X não


presentes entre os dados originais. Isto é, trabalhamos com possíveis valores
de X e obtemos valores de Y, desde que boa parte da variabilidade de Y seja, de
fato, explicada por X.

Seleção de variáveis – consiste em selecionar as variáveis que têm algum


impacto significante em relação à variável de interesse (variável resposta).

Estimação de parâmetros – encontrar valores que são utilizados para inferir


resultados sobre os parâmetros da população, por exemplo, cálculo de doses
letais, tempo até a cura de uma doença, porcentagem de falha de uma
máquina industrial, etc.

Inferência – após encontrar os valores dos parâmetros, o processo de


inferência serve para discutir/inferir resultados sobre uma dada população e
estabelecer critérios como intervalo de confiança sobre tais resultados.

No que tange aos modelos de regressão, algumas nomenclaturas são importantes.


Por exemplo, as variáveis Xs são chamadas variáveis independentes ou
explanatórias, enquanto que a variável Y é chamada de variável dependente ou
resposta. Com esses nomes em mãos, vamos estabelecer o modelo de regressão
linear simples. Suponha que a relação verdadeira entre X e Y pode ser escrita pode
uma equação de reta. Então, o valor esperado de Y para cada valor de X é dado
por:

E(Y X) =  β 0 +  β 1 X

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/12
04/08/22, 09:27 lddkls221_met_mat

sendo que os parâmetros da equação da reta Q = { p

q
 ;  p, q ∈ Z,  q ≠ 0} e 
Q = {
p

q
 ;  p, q ∈ Z,  q ≠ 0} são constantes desconhecidas. Quando X = 0, β 0

representa o ponto onde a reta corta o eixo dos Ys. Esse parâmetro é chamado de
intercepto. Por outro lado, β é chamado coeficiente de regressão ou declive da

0
1

reta e ter interpretação descrita como “a cada aumento de 1 unidade em X, temos

seõçatona reV
que E(Y ∣ X) aumenta β   unidades”. 
1

Agora, dados (X 1, Y 1 ), … , (X n , Y n ) , se for admitido que Y é uma função linear


de X, o modelo de regressão linear simples é dado por:

Y i =  β 0 +  β 1 X i +  ϵ i ,  i  =  1,2, … ,  n

sendo β e β os parâmetros do modelo e ϵ é o erro aleatório do modelo. Alguns


0 1 i

pressupostos desse modelo devem ser levados em consideração (HENRIQUES,


2011): 

(i)  A relação entre Y e X é linear.

(ii)  A média do erro aleatório é nula, isto é, E(ϵ i )  =  0 .

(iii)  Para um dado valor de X, a variância do erro ϵ é sempre σ , isto é,  i


2

2
V ar(ϵ i ) =  E(ϵ )– [E(ϵ i )]   =  E(ϵ ) = σ
i
2 2
i
2
, o que implica que 
V ar(Y i ) = E[Y i  –E(Y i X i )]   =  E(ϵ ) = σ
2 2
i
2

(iv)  O erro de uma observação é independente do erro de outra observação, isto


é, Cov(ϵ i,  ϵ i ′ ) = E(ϵ i ϵ i ′ ) − E(ϵ i )E(ϵ i ′ ) = E(ϵ i ϵ i ′ ) = 0; i ≠ j .

(v)  Os erros têm distribuição normal, isto é, ϵ i ~N (0, σ


2
) e, portanto, 
Y i ~N (β 0 + β 1 X i ,  σ )
2

Agora nosso problema é, necessariamente, estimar os parâmetros β e β do 0 1

modelo. Para isso, trabalhamos com o método dos mínimos quadrados, que é
baseado em um minimizar o comprimento do vetor ϵ = c(ϵ 1, … ,  ϵ n )′ . Pela
definição da norma Euclidiana, temos que:
2 n 2 n 2 n 2
Z  =  ||ϵ|| =  ∑ ϵ =  ∑ [Y i −  E(Y i X i )] =  ∑ [Y i −  β 0 −  β 1 X i ]
i = 1 i i = 1 i = 1

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/12
04/08/22, 09:27 lddkls221_met_mat

Deseja-se, portanto, estimar β e β , tal que Z seja mínimo. Esse método é
0 1

chamado método dos mínimos quadrados. Para isso, obtém-se as derivadas


parciais:

0
∂Z n
=   −  2  ∑ [Y i −  β 0 −  β 1 X i ]
∂β 0 i = 1

seõçatona reV
∂Z n
=   −  X i ∑ [Y i −  β 0 −  β 1 X i ]
∂β 1 i = 1

Igualando ambas as derivadas a zero, obtemos as equações normais:


n
∑ Y i =  nβ ˆ  ∑ n
ˆ  + β Xi
i = 1 0 1 i = 1


n

i = 1
ˆ  ∑ n
Xi Yi = β 0 i = 1
ˆ  ∑ n
Xi + β 1 i = 1
X
2
i
.
¯
¯
ˆ = Y − β
β 0
ˆX
1 de onde tiramos que  . Por outro lado, substituindo a expressão
de β
ˆ no sistema das equações normais, obtemos que o estimador de β é dado
0 1

por:
n
¯
¯
∑ (X i − X )(Y i −  Y )
i = 1
ˆ =
β 1 n
2
¯
∑ (X i − X )
i = 1

EXEMPLIFICANDO

Para exemplificar como se utiliza o modelo de regressão, vamos considerar


um exemplo em que Y = “Milhas por Galão (mpg)” e X = “Peso do Veículo”,
em que nosso objetivo é verificar se X causa influência em Y. Os dados
desse exemplo se encontram disponível no software R com o nome de
“mtcars”. 

Inicialmente, vamos trabalhar com o diagrama de dispersão. Nesse caso, de


acordo com a Figura 3.2, podemos observar que há uma tendência
aparentemente linear e negativa, o que indica que o coeficiente de
correlação está próximo de -1. Fazendo os cálculos da correção, obtemos
que ela é dada por ρ = −0,87, que implica em um coeficiente de
determinação igual a R 2
= 0,75 , isto é, cerca de 75% da variabilidade de Y
é explicada por X. 

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/12
04/08/22, 09:27 lddkls221_met_mat

Figura 3.2 | Diagrama de dispersão de X e Y considerando a base de dados do software R,


mtcars

0
seõçatona reV
Fonte: elaborada pelo autor.

Vamos ao modelo de regressão. Sabemos que:


n
¯
¯
∑ (X i − X )(Y i −  Y )
ˆ =
β
i = 1

1 n
2
¯
∑ (X i − X )
i = 1

e
ˆ
¯
¯ ˆ
β0 = Y − β1 X

Realizando os cálculos, temos:

Declive - β
ˆ = −5,3445 indica que, em cada unidade em que o peso
1

aumenta, as milhas por galão do veículo reduzem, em média, 5,3445 mpg.

Ordenada na origem - β


ˆ = 37,2851. Nesse caso, temos que quando o
0

peso do veículo é igual a zero, as milhas por galão são, em média, 37,2851
mpg. Perceba que essa interpretação, na prática, é impossível de acontecer

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/12
04/08/22, 09:27 lddkls221_met_mat

dado que qualquer veículo tem um peso mínimo. Essa impossibilidade nos
mostra que, na ausência de mais informação, a validade de uma relação
linear não pode ser extrapolada para longe dos valores observados de x.

0
E com isso encerramos nossa seção sobre análise de regressão, viu como é

seõçatona reV
importante essa ferramenta? Deixo também como encerramento a seguinte
reflexão.

REFLITA

Como você trabalharia com análise de regressão na sua área de trabalho?


Qual software você utilizaria? Conhece algum?

FAÇA VALER A PENA


Questão 1
Quando falamos de análise de regressão, precisamos entender quais são os
objetivos de uma regressão linear, isto é, com que finalidade usamos um modelo
de regressão linear. Caso não saíbamos o que seja isso, o uso deve perder sua
essência.

Com base nos objetivos de um modelo de regressão linear, assinale a alternativa


correta.

a.  O uso de um modelo de regressão linear tem por objetivos: determinação, seleção de variáveis,
estimação de parâmetros, circunferência.

b.  O uso de um modelo de regressão linear tem por objetivos: predição, seleção de cofatores, estimação de
erro, inferência.

c.  O uso de um modelo de regressão linear tem por objetivos: probabilidade, seleção de variáveis,
estimação de parâmetros, referência.

d.  O uso de um modelo de regressão linear tem por objetivos: predição, seleção de variáveis, estimação de
parâmetros, inferência.

e.  O uso de um modelo de regressão linear tem por objetivos: previsão, predição, estimação de erro,
normalidade dos dados.

Questão 2

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/12
04/08/22, 09:27 lddkls221_met_mat

Suponha que ao avaliar um modelo de regressão a respeito das variáveis Y =


{produção de uvas} e X = {taxa de irrigação}, você se deparou com coeficiente de
determinação de R 2
= 0,97 . A partir desse coeficiente, deseja-se conhecer sua
interpretação e também o coeficiente de correlação entre as variáveis.

0
Com base na definição de coeficiente de correlação, assinale a alternativa correta.

seõçatona reV
a.  O coeficiente de determinação igual a 0,97 indica que 97% da variabilidade da produção de uvas não é
explicada pela taxa de irrigação. Além disso, o coeficiente de correlação entre as variáveis é de 0,984, que
indica uma correlação positiva e fraca entre a produção de uva e a taxa de irrigação.

b.  O coeficiente de determinação igual a 0,97 indica que 97% da variabilidade da produção de uvas é
explicada pela taxa de irrigação. Além disso, o coeficiente de correlação entre as variáveis é de 0,984, que
indica uma correlação positiva e forte entre a produção de uva e a taxa de irrigação.

c.  O coeficiente de determinação igual a 0,97 indica que 97% da variabilidade da produção de uvas não é
explicada pela taxa de irrigação. Além disso, o coeficiente de correlação entre as variáveis é de 0,984, que
indica uma correlação positiva e forte entre a produção de uva e a taxa de irrigação.

d.  O coeficiente de determinação igual a 0,97 indica que 97% da variabilidade da produção de uvas é
explicada pela taxa de irrigação. Além disso, o coeficiente de correlação entre as variáveis é de 0,984, que
indica uma correlação negativa e forte entre a produção de uva e a taxa de irrigação.

e.  O coeficiente de determinação igual a 0,97 indica que 97% da variabilidade da produção de uvas é
explicada pela taxa de irrigação. Além disso, o coeficiente de correlação entre as variáveis é de 0,984, que
indica uma correlação negativa e fraca entre a produção de uva e a taxa de irrigação. 

Questão 3
Suponha que Y seja uma variável relacionada com velocidade e X uma variável
relacionada com distância percorrida. Foi admitido um modelo de regressão linear
¯
¯
Y = 15,4 X = 42,98 os dados gerados por essas variáveis, tal que  ,  , e 
ˆ = 0,1656
β 1 .

Com base no conceito de análise de regressão linear simples, assinale a alternativa


que contém o valor de β
ˆ e sua interpretação.
0

a. β
ˆ = 8,2839. Esse valor significa que quando a distância percorrida está no marco zero quilômetro, a
0

velocidade do veículo é de 8,2839 km/h.

b. β
ˆ
0 = 4,2839. Esse valor significa que quando a distância percorrida está no marco zero quilômetro, a

velocidade do veículo é de 4,2839 km/h.

c. β
ˆ = 8,2839. Esse valor significa que quando a velocidade do veículo é de 0 km/h, a distância percorrida
0

será 8,2839 km.

ˆ
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/12
04/08/22, 09:27 lddkls221_met_mat

d. β
ˆ
0 = 2,2839. Esse valor significa que quando a distância percorrida está no marco zero quilômetro, a

velocidade do veículo é de 2,2839 km/h.

e. β
ˆ = 1,2839. Esse valor significa que quando a velocidade do veículo é de 0 km/h, a distância percorrida
0

será 1,2839 km. 

0
REFERÊNCIAS

seõçatona reV
AMARAL, G. D.; SILVA, V. L.; REIS, E. A. Análise de Regressão Linear no Pacote R.
Relatório Técnico Série Ensino RTE 001/2009. Universidade Federal de Minas
Gerais, Belo Horizonte, 2009. Disponível em:
http://www.est.ufmg.br/portal/arquivos/rts/RT-SE-2009.pdf. Acesso em: 12 abr.
2021.

HENRIQUES, C. Análise de regressão linear simples e múltipla. Departamento


de Matemática. Escola Superior de Tecnologia de Viseu. Portugal, 2011.

MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. Editora


da Universidade de São Paulo, 2002.

NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.

THE R Project for Statistical Computing. Disponível em: https://www.r-project.org.


Acesso em: 12 abr. 2021.

VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/12
04/08/22, 09:27 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


REGRESSÃO LINEAR E CORRELAÇÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Dado que trabalhamos com análise de regressão linear simples nesta seção, então
um modelo sugerido é um que só tem uma variável preditora. Nesse caso,
podemos trabalhar com o modelo:

Ozonio = β 0 + β 1 T emperatura

Para estimar os parâmetros desse modelo, podemos considerar as equações:


n
¯
¯
∑ (X i − X )(Y i −  Y )
ˆ =
β
i = 1

1 n
2
¯
∑ (X i − X )
i = 1

e
ˆ
¯
¯ ˆ
β0 = Y − β1 X

Ou utilizar o comando “lm” do software R. Sendo assim, realizando os cálculos,


temos:

Declive - β
ˆ = 2,429 indica que, em cada unidade em que a temperatura
1

aumenta, a concentração de ozônio aumenta, em média, 2,429 ppm.

Ordenada na origem - β


ˆ = −146,995. Nesse caso, temos que quando a
0

temperatura é igual a zero, a concentração de ozônio é, em média, -146,995 ppm,


o que na prática é impossível de acontecer, tornando nosso modelo duvidoso e
necessitando de mais dados.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:27 lddkls221_met_mat

Dessa forma, concluímos que o modelo linear talvez não seja o melhor modelo
para trabalhar com os dados da nossa amostra sobre poluição atmosférica.

AVANÇANDO NA PRÁTICA

0
SÉPALAS DE PLANTAS

seõçatona reV
Suponha que um certo engenheiro genético tenha lhe contratado para avaliar as
sépalas de plantas. O interesse é saber o que acontece com o tamanho da sépala
quando mexemos com o tamanho da pétala. O engenheiro não sabia como
descrever isso em um modelo matemático e solicitou sua ajuda. Sabendo que os
dados dessa pesquisa se encontram no banco de dados “iris” do software R, como
você montaria o modelo matemático para ajudá-lo? Além disso, como você
estimaria esse modelo? E as interpretações dos resultados obtidos? Discorra sobre
essas questões a fim de dar uma resposta ao engenheiro.

RESOLUÇÃO 

Dado que trabalhamos com análise de regressão linear simples nesta seção,
então um modelo sugerido é um que só tem uma variável preditora. Nesse
caso, podemos trabalhar com o modelo:

é
S pala = β 0 + β 1 P étala

Para estimar os parâmetros desse modelo, podemos considerar as equações:


n
¯
¯
∑ (X i − X )(Y i −  Y )
ˆ =
β
i = 1

1 2
n
¯
∑ (X i − X )
i = 1

e
ˆ
¯
¯ ˆ
β0 = Y − β1 X

ou utilizar o comando “lm” do software R. Sendo assim, realizando os cálculos,


temos:

Declive - β
ˆ
= 0,4089 indica que, em cada unidade em que o tamanho da
1

pétala aumenta, o tamanho da sépala aumenta, em média, 0,4089 cm.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:27 lddkls221_met_mat

Ordenada na origem - β


ˆ
= 4,3066. Nesse caso, temos que quando o
0

tamanho da pétala é igual a zero, o tamanho da sépala é 4,3066 cm, o que


pode acontecer na prática.

0
Além disso, calculando a correlação entre as variáveis, obtemos que o

seõçatona reV
coeficiente de correlação é de 0,87, que indica uma associação linear positiva e
forte, justificando nosso modelo. Então, podemos responder ao engenheiro
que, de fato, o tamanho da sépala é influenciado pelo tamanho da pétala e as
taxas de variação são as taxas descritas anteriormente para os parâmetros do
modelo.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:27 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

ESTATÍSTICA DESCRITIVA

0
Ricardo Puziol de Oliveira

seõçatona reV
CONVITE AO ESTUDO
Caro aluno, você sabia que uma das melhores maneiras de representar dados é
com gráficos e tabelas? E fazendo esse tipo de representação, você está
trabalhando com estatística? Nesta unidade, vamos trabalhar com os principais
conceitos de estatística, iniciando-se com a estatística descritiva e os principais
tipos de gráficos. Logo em seguida, vamos revisar algumas definições de população
e amostra, além dos conceitos de probabilidade. No entanto, nosso foco será
trabalhar com resumo de dados e cálculos de probabilidades condicionais que são
amplamente utilizados em testes de diagnósticos e também para encontrar o
padrão-ouro, que é fundamental para comparação de parâmetros. Por fim, vamos
entender os testes de hipóteses, que são fundamentais quando o assunto é tomar
uma decisão. Vamos entender todos os fatores que afetam uma tomada de
decisão e como decidir, estatisticamente falando.

Algo que você pode estar se perguntando é: mas como utilizamos a estatística em
áreas como a Engenharia? Para exemplificar, suponha que você trabalhe com
energia eólica e seu patrão te faça tomar uma decisão se este tipo de energia é útil
e se vai gerar lucros e ser sustentável. O que você faria? Naturalmente, você
coletaria dados e elaboraria uma hipótese que seria validada por métodos
estatísticos para apresentar seus resultados e apresentaria gráficos. Viu como a
estatística é importante nesse aspecto? Para lhe auxiliar, vamos, no decorrer desta
unidade, aprender um pouco mais sobre ela! Então, mãos à obra!

PRATICAR PARA APRENDER

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/14
04/08/22, 09:27 lddkls221_met_mat

Nesta seção, iremos entender como construir gráficos e tabela e como trabalhar
com isso na prática. Esses conceitos são fundamentais, uma vez que são úteis para
resumir informações e gerar apresentações a comitês sobre os resultados.

0
Como exemplo dessa abordagem, podemos considerar que você tenha interesse
em lançar um serviço no mercado. Para isso, você deve realizar um experimento

seõçatona reV
que irá gerar dados e você deve organizá-los em tabelas e gráficos para poder
fazer um resumo dos seus resultados para a apresentação em um determinado
comitê para aprovação do seu serviço. Viu como é importante entender essa
questão? Gráficos bem detalhados e corretos te dão uma boa visão do que está
ocorrendo em determinado setor e também é útil para mostrar à empresa as
projeções.

Nos dias atuais, em qualquer apresentação empresarial, os gráficos fazem parte


desse mundo, trazendo e até às vezes inovando a forma de exibir os resultados de
uma empresa. Pensando nisso, seu gerente pediu sua sugestão para propor uma
nova apresentação das vendas do último trimestre dos últimos 10 anos da
empresa. A ideia é fazer com que esses valores fiquem apresentáveis, porém ele
não tem nenhuma ideia de como fazer isso. Como você faria essa apresentação?
Que tipo de gráfico você utilizaria para expor as vendas? E como você interpretaria
esse gráfico?

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo! Iniciaremos com os conceitos de tabelas e, depois, passaremos para os
gráficos e uso do Excel!

CONCEITO-CHAVE
Quando falamos de dados e o que eles mostram, estamos falando de estatística,
mas o que é estatística? Como podemos definir esse conceito? Em termos gerais,
podemos definir estatística como um conjunto de técnicas e métodos para

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/14
04/08/22, 09:27 lddkls221_met_mat

realização de experimentos, coleta e análise de dados (NETO, 2006). Duas


ferramentas são essenciais quando trabalhamos com estatística: população e
amostra.

0
ASSIMILE

seõçatona reV
População: dizemos que um conjunto de elementos é uma população se
tais elementos têm pelo menos uma característica em comum. Como
exemplo de populações, temos árvores de uma determinada espécie,
poluentes atmosféricos, pessoas que têm olhos de cor clara, etc.

Amostra: dizemos que um subconjunto de elementos é uma amostra


quando ele for subconjunto de uma dada população. Como exemplo de
amostra, podemos considerar um subconjunto de pessoas que têm olhos
azuis da população de pessoas de olhos de cor clara.

Certo, agora que sabemos o que é uma população e uma amostra, que são as
bases dos trabalhos de estatística, vamos introduzir um novo conceito que nos
auxilia a construir métodos estatísticos no futuro. Esse conceito é o conceito de
variável.

ASSIMILE

Variável: dizemos que uma determinada característica é uma variável se


determina a natureza de uma população e pode assumir diversas
classificações de acordo com a origem da população. No planejamento da
pesquisa, por exemplo, devemos definir quais são as nossas características
de interesse, antes da coleta dos dados.

É importante lembrar que as variáveis, em geral, têm natureza diferente, o que nos
leva à classificá-las em dois grupos: quantitativas e qualitativas. Como definimos
esses conceitos? Vamos começar com as variáveis quantitativas. Tais variáveis
dizem respeito a características que podem ser medidas ou contadas, por

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/14
04/08/22, 09:27 lddkls221_met_mat

exemplo, o preço de um ativo no mercado financeiro, o número de árvores de uma


determinada espécie, a taxa de hemoglobina de um paciente, etc. E as variáveis
qualitativas, como definimos? Ora, como o próprio nome já diz, qualidade. Essas
variáveis estão ligadas à descrição de uma característica, não podendo ser contada

0
ou medida, mas podendo ser observada, por exemplo, o nível educacional, a cor

seõçatona reV
dos olhos, o sexo de um animal, etc. 

Além dessas classificações de variáveis, podemos ainda classificá-las em


subcategorias. Isto é, no caso das variáveis qualitativas, podemos classificá-las em
qualitativa nominal (quando não há uma ordem de classificação) ou qualitativa
ordinal (quando há uma ordem de classificação). Exemplos de variáveis qualitativas
nominais envolvem espécie de uma planta, cor dos olhos, sexo de um animal, etc.
Já os exemplos de variáveis qualitativas ordinais envolvem a classificação do nível
escolar, nível de urgência em um hospital, etc. (NETO, 2006).

Por outro lado, podemos também classificar as variáveis quantitativas em dois


grupos: discretas ou contínuas. As discretas são aquelas que são originadas de um
processo de contagem, como o número de peixes de uma espécie X em um
determinado lago. Já as contínuas, bem, não existe uma contagem e podem
assumir qualquer valor na reta real, como temperatura, índices pluviométricos, etc.
(NETO, 2006).

REFLITA

Como você acha que devemos representar as variáveis? É possível ter um


novo tipo de classificação de uma variável?

Certo, agora que sabemos o que é uma variável e suas classificações, vamos
trabalhar com a exposição de dados. Em geral, representamos os dados por
tabelas de frequência, que consiste, basicamente, em listar os valores possíveis da
variável, numéricos ou não, e fazer a contagem na tabela de dados brutos do
número de suas ocorrências (VIRGILITO, 2017). De acordo com Magalhães (2002),
são componentes de uma tabela de frequência:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/14
04/08/22, 09:27 lddkls221_met_mat

1. Frequência absoluta (f ): é o número de observações correspondente a cada


i

classe da variável. Em geral, ela é chamada apenas de frequência.

2. Frequência relativa (f ): é o quociente entre a frequência absoluta da classe


r

0
correspondente e a soma das frequências (total observado), isto é, f ri =
fi

∑ fj
j

onde n representa o número total de observações.

seõçatona reV
3. Frequência percentual (p ): é obtida multiplicando a frequência relativa por
i

100%.

4. Frequência acumulada (F ): é o total acumulado (soma) de todas as classes


i

anteriores até a classe atual.

EXEMPLIFICANDO

Suponha que uma dada variável que representa a concentração de metal


no sangue (em μg/ml) de um paciente tenha como dados observados os
valores: 20, 20, 20, 20, 21, 21, 21, 22, 22, 22, 22, 22, 23, 24, 24. Como
representamos esses dados em tabela de frequência? Nesse caso, podemos
trabalhar com a seguinte tabela de frequência:

Tabela 4.1 | Concentração de um metal no sangue (em μg/ml) dos pacientes

Concentração de metal Número de indivíduos %

20 4 26,67

21 3 20,00

22 5 33,33

23 1 06,67

24 2 13,33

Total 15 100,00

Fonte: elaborada pelo autor (2021).

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/14
04/08/22, 09:27 lddkls221_met_mat

No exemplo anterior, trabalhamos com uma representação de dados discretos.


Mas como trabalhamos com dados contínuos? Nesse caso, dado que não podemos
fazer uma contagem, trabalhamos com faixa de variações divididas em intervalos
de classes, onde o menor valor da classe é denominado limite inferior (l ) e o maior

0
i

valor da classe é denominado limite superior (L ) (NETO, 2006). O intervalo ou a i

seõçatona reV
classe podem ser representados das seguintes maneiras (MAGALHÃES, 2002):

1. l i ⊢ Li , onde o limite inferior da classe é incluído na contagem da frequência


absoluta, mas o superior não.

2. i ⊣ Li , onde o limite superior da classe é incluído na contagem, mas o inferior


não.

Assim, para montar a tabela de frequência, acrescentamos uma coluna com os


pontos médios de cada intervalo de classe, denotada por x , que é definido como  i

xi =
li + Li

2
. Certo, mas como definimos a quantidade de intervalos de classe que
vamos utilizar? Nesse caso, utilizamos a regra de Sturges para obter o número de
intervalos de classes, isto é, k = 1 + 3,3 log n, em que k é o número de intervalos
de classe e n é o tamanho do conjunto de dados.

EXEMPLIFICANDO

Suponha que em uma cidade X as precipitações diárias (em mm) foram


dadas por 350, 260, 390, 250, 390, 210, 400, 160, 320, 390, 230, 150, 270,
440, 500 no mês de agosto de 2020. A partir dessas observações, pela regra
de Surges, vamos considerar cinco classes, uma vez que k=4,88≈5. Nesse
caso, uma tabela de frequência relativa a essas precipitações diárias (em
mm) da cidade é descrita por:

Tabela 4.2 | Precipitações diárias (em mm) em uma cidade X em agosto de 2020

Precipitação (mm) Número de cidades %

150 ⊢ 220 3 20

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/14
04/08/22, 09:27 lddkls221_met_mat

Precipitação (mm) Número de cidades %

220 ⊢ 290 4 26,67

0
290 ⊢ 360 2 13,33

seõçatona reV
360 ⊢ 430 4 26,67

430 ⊢ 500 2 13,33

Total 15 100

Fonte: elaborada pelo autor (2021).

Entendemos então como funcionam as tabelas de frequência, vamos agora para


outra ferramenta importante para a análise de dados: os gráficos. As
representações gráficas de tabelas de distribuições de frequências permitem uma
visualização a respeito do comportamento das variáveis, incluindo sua dispersão.
Em geral, a utilização de gráficos para resumir os resultados de uma pesquisa é
comum e é sempre recomendável. E já que estamos falando de gráficos, alguns
pontos devem ser levados em conta na sua construção (MAGALHÃES, 2002):

1. Devem ser claros, simples, atrair a atenção e inspirar confiança.

2. Servem para resumir resultados importantes de uma pesquisa.

3. Sempre devem ter um título completo e ser colocado na parte superior do


gráfico.

4. Devem ser construídos numa escala que não implique outros tipos de
interpretações.

5. Deve-se sempre especificar (dar nome) e graduar (criar escala) os eixos.

6. Quando os dados não são próprios, deve-se citar a fonte de origem dos dados
do gráfico.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/14
04/08/22, 09:27 lddkls221_met_mat

Vamos então trabalhar com alguns tipos de gráficos, iniciando-se com o gráfico de
barras. O gráfico de barras apresenta dados categorizados em barras retangulares
em que cada barra é proporcional ao número de observações naquela categoria da
variável (NETO, 2006). Utilizamos esse tipo de gráfico, em geral, para realizar

0
comparações entre as categorias de uma variável qualitativa ou quantitativa

seõçatona reV
discreta. E como fazemos esse gráfico em um software como o Excel? Ora, nesse
caso, digitamos os nossos dados na planilha e vamos em Inserir > Gráficos > Barra.
Como exemplo, vamos considerar o gráfico de barras feito no Excel exposto na
Figura 4.1.

Figura 4.1 | Gráfico de barras correspondente à precipitação total (em mm) de 1 ano em quatro cidades
diferentes

Fonte: elaborada pelo autor (2021).

Vimos que o gráfico de barras é um gráfico para variáveis qualitativas ou variável


quantitativa discreta, mas e para variável quantitativa contínua, qual gráfico
utilizamos? Nesse caso, trabalhamos com o histograma, que é uma representação
gráfica da distribuição de frequências em intervalos de classes de dados
quantitativos contínuos. E como fazemos esse gráfico no Excel? Ora, seguimos o

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/14
04/08/22, 09:27 lddkls221_met_mat

mesmo caminho do gráfico de barras, só mudamos o tipo de gráfico. Nesse caso,


vamos na opção Inserir > Gráficos > Histograma. Como exemplo, vamos considerar
o histograma feito no Excel exposto na Figura 4.2.

0
Figura 4.2 | Precipitação (mm) em 15 cidades no mês de agosto

seõçatona reV
Fonte: elaborada pelo autor (2021).

Vimos então como lidar com gráficos de barras e com o histograma. No entanto,
temos um terceiro tipo de gráfico que é de suma importância para variáveis
qualitativas nominais, que é o gráfico de setores. Esse tipo de gráfico é a
representação gráfica da frequência relativa (percentagem) de cada categoria da
variável qualitativa (NETO, 2006). E no Excel, como fazemos esse tipo de gráfico?
Ora, trabalhamos como nos anteriores, Inserir > Gráfico > Pizza 2D, nesse caso.
Como exemplo, vamos considerar a representação dos dados de duas espécies de
plantas descritos na Tabela 4.3 a seguir.

Tabela 4.3 | Dados relativos a duas espécies de plantas e suas respectivas porcentagens em um dado
estudo biológico

Plantas Amostras %

Carnívoras 250 25

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/14
04/08/22, 09:27 lddkls221_met_mat

Plantas Amostras %

Não carnívoras 750 75

0
Total 1000 100

seõçatona reV
Fonte: elaborada pelo autor (2020).

Figura 4.3 | Gráfico de setores do número de plantas de espécies carnívoras e não carnívoras em uma
determinada região

Fonte: elaborada pelo autor (2021).

Um outro tipo de gráfico popular é o de linhas. É um tipo de gráfico que exibe


informações de uma série temporal em que os valores do eixo x representam a
escala de tempo e os valores do eixo y os dados observados. Os pontos são ligados
por segmentos de reta (MAGALHÃES, 2002). E como fazemos no Excel? Da mesma
forma que os anteriores, Inserir > Gráfico > Gráfico de linhas. Como exemplo,
considere a concentração de nitrogênio no decorrer dos anos em um determinado
rio, conforme a Figura 4.4.

Figura 4.4 | Concentrações de nitrogênio em um determinado rio nos últimos anos

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/14
04/08/22, 09:27 lddkls221_met_mat

0
seõçatona reV
Fonte: elaborada pelo autor (2021).

Agora, para encerrar nosso estudo de gráficos e tabelas, vamos considerar o


boxplot, que é gráfico utilizado para avaliar a distribuição empírica dos dados e é
extremamente comum em pesquisas médicas, por exemplo. Esse gráfico é,
basicamente, formado pelo primeiro e terceiro quartil e pela mediana. No Excel,
trabalhamos da mesma forma que nos anteriores, Inserir > Gráfico > Boxplot.
Como exemplo, vamos trabalhar com as concentrações de chumbo no sangue de
pacientes de um determinado hospital após sofrerem um acidente de trabalho em
uma mina. As concentrações (em μg/ml) de cada paciente estudado são dadas
por: 15.2; 10.5; 20.1; 14.2; 13.2; 15.8; 15.7; 14.2; 11.5; 17.8; 18.5. Utilizando-se o
Excel, o gráfico dessa situação é dado pela Figura 4.5.

Figura 4.5 | Boxplot das concentrações de chumbo no sangue de pacientes após um acidente de
trabalho em uma mina

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/14
04/08/22, 09:27 lddkls221_met_mat

0
Fonte: elaborada pelo autor (2021).

seõçatona reV
E com isso encerramos nossa seção sobre tabelas e gráficos, que são as
ferramentas essenciais quando trabalhamos com estatística. Lembre-se sempre de
usá-los quando você estiver atuando em sua área de trabalho!

FAÇA VALER A PENA


Questão 1
Analise o trecho a seguir:

Tipo de gráfico que exibe informações de uma série temporal em que os valores
do eixo x representam a escala de tempo e os valores do eixo y os dados
observados. Os pontos são ligados por segmentos de reta (MAGALHÃES, 2002).

Assinale a alternativa correta.

a.  O gráfico referido no trecho é o gráfico de dispersão. 

b.  O gráfico referido no trecho é o gráfico de barras.

c.  O gráfico referido no trecho é o gráfico de setores.

d.  O gráfico referido no trecho é o gráfico de linha.

e.  O gráfico referido no trecho é o histograma. 

Questão 2
Suponha que você deseja avaliar as concentrações de um dado composto químico.
Por rigor empresarial, você deve apresentar os resultados em forma de gráfico a
partir de uma tabela de frequência dividida em intervalos de classe e assumindo
que os dados são exposto em escala contínua.

Com base nos tipos de gráficos, assinale a alternativa correta.


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/14
04/08/22, 09:27 lddkls221_met_mat

a.  O gráfico necessário para trabalhar com esses dados é o gráfico de dispersão.

b.  O gráfico necessário para trabalhar com esses dados é o gráfico de linha.

c.  O gráfico necessário para trabalhar com esses dados é o gráfico de setores.

0
d.  O gráfico necessário para trabalhar com esses dados é o histograma. 

seõçatona reV
e.  O gráfico necessário para trabalhar com esses dados é o gráfico de barras. 

Questão 3
Suponha que as concentrações de sódio em um determinado alimento produzido
anualmente sejam descritas pelo seguinte gráfico de linhas exposto na Figura 4.8.

Figura 4.8 | Gráfico de linhas da concentração de sódio em um determinado alimento em 15 anos de


produção

Fonte: elaborada pelo autor (2021).

Suponha também que nos interessa saber como interpretar esse gráfico para tirar
conclusões acerca do sódio desse alimento em anos diferentes da sua produção.

Assinale a alternativa correta


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 13/14
04/08/22, 09:27 lddkls221_met_mat

Assinale a alternativa correta.

a.  No período entre 2013 e 2015, houve uma alta da concentração de sódio no alimento, atingindo o pico
máximo em 2015. Entre 2015 e 2017, houve uma queda da concentração de sódio, tendo-se como mínimo o
valor de concentração em 2017.

b.  No período entre 2013 e 2015, houve uma queda da concentração de sódio no alimento, atingindo o pico

0
máximo em 2015. Entre 2015 e 2017, houve uma alta da concentração de sódio, tendo-se como máximo o
valor de concentração em 2017.

seõçatona reV
c.  No período entre 2015 e 2017, houve uma alta da concentração de sódio no alimento, atingindo o pico
máximo em 2015. Entre 2013 e 2015, houve uma queda da concentração de sódio, tendo-se como mínimo o
valor de concentração em 2017. 

d.  No período entre 2005 e 2015, só houve alta da concentração de sódio no alimento, atingindo o pico
máximo em 2015. Entre 2015 e 2020, houve uma queda da concentração de sódio, tendo-se como mínimo o
valor de concentração em 2017.

e.  No período entre 2005 e 2010, houve uma alta da concentração de sódio no alimento, atingindo o pico
máximo em 2005. Entre 2017 e 2020, houve uma queda da concentração de sódio, tendo-se como mínimo o
valor de concentração em 2017.  

REFERÊNCIAS
HENRIQUES, C. Análise de regressão linear simples e múltipla. Departamento
de Matemática. Escola Superior de Tecnologia de Viseu. Portugal, 2011.

JUNIOR, P. J. R. Introdução ao Ambiente Estatístico R. In: JUNIOR, P. J. R. Gráficos no


R. Universidade Federal do Paraná, Curitiba, 2011. Disponível em:
http://www.leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase9.html. Acesso
em: 13 abr. 2021.

MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. São


Paulo: Editora da Universidade de São Paulo, 2002.

NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.

THE R Project for Statistical Computing. Disponível em: https://www.r-project.org.


Acesso em: 12 abr. 2021.

VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 14/14
04/08/22, 09:28 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


ESTATÍSTICA DESCRITIVA

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Visto que a natureza da variável é quantitativa contínua, devemos pensar em
gráficos relacionados com essa variável. Uma outra coisa deve ser levada em conta
também, a escala temporal. Isto é, a ideia é avaliar as vendas do último trimestre
nos últimos 10 anos da empresa, então temos uma escala temporal de 10 anos,
uma observação por ano. Isso nos define um tipo de gráfico chamado gráfico de
linha, que nos traz a informação de uma variável quantitativa contínua em escala
temporal, como podemos ver, por exemplo, na Figura 4.6.

Figura 4.6 | Exemplo de gráfico de linha para variáveis em escala temporal

Fonte: elaborada pelo autor (2021).

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:28 lddkls221_met_mat

Podemos interpretar esse gráfico da seguinte maneira: o lucro da empresa sofreu


uma alta nos anos de 2011 e 2017, sendo a maior alta em 2017, e uma queda
brusca entre 2011 e 2012. Embora entre 2012 e 2017 a empresa estava se
recuperando, em 2018 ela teve outra queda brusca e o menor lucro dos 10 anos

0
considerado na análise. Voltou a crescer em 2019, chegando próximo ao valor do

seõçatona reV
lucro obtido no ano de 2010 somente no ano de 2020, após a queda de 2018.

AVANÇANDO NA PRÁTICA

POLUIÇÃO ATMOSFÉRICA POR CO 2

Uma determinada empresa deseja reduzir a quantidade de CO  que emite, 2

porém, para fazer isso, ela precisa avaliar as concentrações de CO  emitidas nos 2

últimos anos para ter uma ideia do que está acontecendo, a fim de reduzir essa
emissão. Para isso, é necessário um tipo de gráfico bem especial para lidar com
escalas temporais. Sabendo que as concentrações dos últimos 15 anos são (em
mg/L): 10, 20, 15, 12, 11, 15, 12, 10, 12, 15, 30, 45, 50, 12, 15, 15; descreva que tipo
de gráfico você utilizaria para mostrar à empresa e como você interpretaria tal
gráfico.

RESOLUÇÃO 

Visto que temos uma escala temporal, no caso de 15 anos, o gráfico sugerido
para esse tipo de análise é um que lide com esse tipo de escala. Após
pesquisas, o gráfico indicado é o de linhas, que, para essa situação, é descrito
na Figura 4.7.

Figura 4.7 | Concentrações de CO  nos últimos 15 anos da empresa


2

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:28 lddkls221_met_mat

0
seõçatona reV
Fonte: elaborada pelo autor (2021).

Podemos interpretar esse gráfico da seguinte maneira: as concentrações de


CO2  emitidas pela empresa tiveram uma alta no ano de 2006 e caíram até ter
novamente uma alta em 2010 e assim seguiu. Porém, em 2017 ela teve o maior
pico de emissão, sendo mais que o dobro de 2006. De 2017 a 2020 houve
redução drástica da emissão de CO . Ao que parece, a empresa tem picos de
2

emissão e nos 3 anos seguintes passa por uma redução. Nesse aspecto, como
sugestão, a empresa deve averiguar as condições de emissão para evitar um
novo pico, que possivelmente acontecerá em 2021.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:28 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

PROBABILIDADE

0
Ricardo Puziol de Oliveira

seõçatona reV
PRATICAR PARA APRENDER
Caro aluno, nesta seção iremos entender o conceito de probabilidade e o que são
as distribuições de probabilidade. Tais conceitos são fundamentais quando
trabalhamos, por exemplo, com modelagem ou, até mesmo, previsão de lucros de
uma empresa.

Como exemplo dessa abordagem, imagine que você tenha interesse em saber, em
média, quanto tempo irá demorar para o seu maquinário falhar para saber quando
será necessário trocar e se programar com o orçamento. Para fazer isso, você deve
considerar a distribuição de probabilidade do tempo de falhar e trabalhar com a
média dessa distribuição. Percebe a importância desse conteúdo?

Os acidentes industriais, na atualidade, embora reduzidos, ainda são um problema


complexo para muitas indústrias. Pensando nisso, você foi contratado para estimar
a probabilidade de acidentes anuais de uma determinada empresa. A única
informação que o dono da empresa lhe passou foi de que a chance de um único
trabalhador se envolver em um acidente é de aproximadamente 0,00024 e que a
empresa tem muitos trabalhadores. Como você faria para estimar esse número?
Como você pode interpretar esse resultado?

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo! Iniciaremos com os conceitos básicos de probabilidade e, depois,
passaremos para as distribuições de probabilidade.

CONCEITO-CHAVE

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/12
04/08/22, 09:28 lddkls221_met_mat

Antes de começar nossos estudos, vamos relembrar um pouquinho da história da


probabilidade. De acordo com o contexto histórico, acredita-se que a teoria da
probabilidade que conhecemos hoje teve seu início com os matemáticos franceses
Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665) em estudos sobre jogos de

0
dados, em que o objetivo era determinar a probabilidade exata (NETO, 2006). 

seõçatona reV
De acordo com Magalhães (2002), na literatura, há três interpretações do conceito
de probabilidade: a frequentista, a clássica e a subjetiva. O enfoque e os detalhes
de cada uma dessas interpretações nós estudamos na Unidade 3, assim, daremos
sequência assumindo que estamos todos familiarizados com tais conceitos. Ele é
válido para o conceito de experimentos, que são classificados em aleatórios e
determinísticos.

Certo, uma vez que temos esses conhecimentos prévios, estamos com todas as
ferramentas para definir o que é, de fato, uma probabilidade. Matematicamente,
dizemos que uma função P definida em uma σ-álgebra Λ de subconjuntos de um
espaço amostral Ω e imagem restrita ao intervalo [0,1], é uma probabilidade se
satisfaz os seguintes axiomas de Kolmogorov (MAGALHÃES, 2002):

1. P (Ω) = 1.

2. Para todo subconjunto A ∈ Λ, 0 ≤  P (Ω) ≤  1.

3. Para toda sequência A 1,  A 2 ,   … ,  A n ,   … ∈ Λ , mutuamente exclusiva, tem-


se que:
∞ ∞
P (∪ A i )  = ∑ P (A i )
i=1 i=1

ASSIMILE

A σ-álgebra Λ é uma “regra” para definir matematicamente a “existência” de


um evento A ∈ Λ e a tripla (Ω,  Λ,  P ) define o espaço de probabilidade. 

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/12
04/08/22, 09:28 lddkls221_met_mat

Pronto, agora sabemos o que é uma probabilidade no sentido matemático. Como a


calculamos, é com base nas interpretações frequentista, clássica e subjetiva
supracitadas. O nosso foco agora é, a partir desse conceito, definir o que é uma
distribuição de probabilidade. Mas antes necessitamos de alguns conceitos

0
preliminares que são de suma importância, como a regra da adição.

seõçatona reV
Regra da adição (MAGALHÃES, 2002): sejam A,  B ∈ Λ. Então 
P (A ∪ B)  =  P (A)  +  P (B)  −  P (A ∩ B) . Por outro lado, se A e B são
eventos mutuamente exclusivos, a probabilidade P (A ∪ B) se reduz a 
P (A ∪ B)  =  P (A)  +  P (B) .

Com a regra da adição em mãos, temos ferramentas para definir a probabilidade


condicional. Antes de fazer essa definição, vamos a uma questão: por que
necessitamos de probabilidade condicional? Ora, em algumas situações, a
probabilidade necessita ser reavaliada sempre que novas informações se tornam
disponíveis e essa nova informação pode causar algum tipo de interferência no
resultado anterior. Nessa situação, trabalhamos então com a chamada
probabilidade condicional. 

Definição 1: seja (Ω,  Λ,  P ) um espaço de probabilidade e sejam os eventos 


A,  B ∈ Λ , então a probabilidade condicional do evento A, dado que o evento B
ocorreu, é definida como:
P (A∩B)
P (A|B) =
P (B)

EXEMPLIFICANDO

Como exemplo, seja espaço amostral descrito por  ε= {lançamento de um


dado} e os seguintes eventos: A = {sair uma face par} e B = {sair menor ou
igual a 3}. Logo, a probabilidade de se obter uma face par, dado que
tivemos um número menor ou igual a 3, é descrita por:
1
P (A∩B) 6
P (A|B) = = 3
  =  0.33
P (B)
6

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/12
04/08/22, 09:28 lddkls221_met_mat

Isto é, como P (A ∣ B) = 0,33 e sabendo que a face foi menor ou igual a 3,


temos evidências de que a chance de sair par é improvável de acontecer.

Bom, definimos a nossa primeira regra, a regra da adição, que foi base para a

0
probabilidade condicional. Será que existem outras regras que são bases para

seõçatona reV
outros tipos de probabilidade? A resposta é sim. Vamos trabalhar com a regra da
multiplicação, que é base do famoso teorema de Bayes.

Regra da multiplicação (MAGALHÃES, 2002): sejam os eventos 


A 1 ,  A 2 ,   … ,  A n com a condição de que P (∩ n−1

i=1
A i )  >  0 , então a regra da
multiplicação de probabilidades é definida como:
n
P (∩ A i ) = P (A 1 )P (A 2 |A 1 ) … P (A n ∣ A 1 ∩ … ∩ A n−1 )
i=1

A partir dessa regra, podemos definir dois teoremas de suma importância no


contexto de probabilidade: o teorema da probabilidade total e o teorema de Bayes.
Esses dois teoremas são a base do que chamamos de inferência bayesiana. Vamos
à definição deles?

Teorema da probabilidade total (MAGALHÃES, 2002): suponha que os eventos 


C 1 ,   … ,  C n , em um espaço de probabilidade (Ω,  Λ,  P ), formam uma partição
de Ω e todos têm probabilidade positiva. Então, para qualquer evento A nesse
espaço de probabilidade, vale que:
n
P (A)  = ∑ P (C i )P (A ∣ C i )
i=1

Teorema de Bayes (MAGALHÃES, 2002): suponha que os eventos C 1,   … ,  C n ,


em um espaço de probabilidade (Ω,  Λ,  P ), formam uma partição de Ω e todos
têm probabilidade positiva. Seja A um evento qualquer com P (A)  >  0, então:
P (C k )P (A|C k )
P (C k |A) = n , k  =  1,  … ,  n
∑ P (C i )P (A|C i )
i=1

Uma das principais aplicações do tão famoso teorema de Bayes é em análises


clínicas no contexto de teste de diagnósticos, em que o objetivo é definir os falsos
positivos e falsos negativos, a fim de encontrar um padrão-ouro.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/12
04/08/22, 09:28 lddkls221_met_mat

REFLITA

Em que outras situações você acha que o teorema de Bayes pode ser
aplicado? Existe condições especiais para essa aplicação?

0
Bom, fizemos então um resumo dos principais conceitos de probabilidade que

seõçatona reV
necessitamos para trabalhar com nossas distribuições de probabilidade. No
entanto, ainda falta uma ferramenta essencial: a variável aleatória. O que é uma
variável aleatória? No que consiste a ideia desse conceito? Basicamente, a ideia de
variáveis aleatórias consiste no conceito de que é possível associar um número real
a cada resultado no espaço amostral Ω. Matematicamente, podemos definir uma
variável aleatória como:

Definição 2 (MAGALHÃES, 2002): uma variável aleatória X em um espaço de


probabilidade (Ω,  Λ,  P ) é uma função real definida no espaço amostral Ω, tal
que:

[X ≤ x] = {ω ∈ Ω,  X(ω) ≤  x)

é um evento aleatório ∀x ∈  R, ou seja, X : Ω → R é uma variável aleatória se:

[X ≤ x] ∈ Λ, ∀x ∈ R

Certo, agora sim temos todas as ferramentas necessárias para lidar com as
distribuições de probabilidade. Mas antes, vamos primeiro classificar as variáveis
aleatórias. Lembra-se de que tínhamos dois tipos de dados quantitativos, discretos
ou contínuos? Pois então, temos a mesma classificação para variáveis aleatórias. 

De acordo com Neto (2006), dizemos que uma variável aleatória X será discreta se
seu domínio/suporte for o conjunto R x =  0, 1,  … ,  m . Caso o domínio dessa
variável aleatória seja o conjunto R x = {x ∈ R,  a  <  x  <  b} , dizemos que essa
variável aleatória é contínua.

Agora que sabemos as classificações, vamos então dar início aos conceitos de
distribuições de probabilidade. Inicialmente, vamos começar com a definição do
que é uma função de distribuição acumulada. Isto é, seja X é uma variável aleatória

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/12
04/08/22, 09:28 lddkls221_met_mat

definida em (Ω,  Λ,  P ), de acordo com Neto (2006), sua função de distribuição
acumulada é escrita na forma:

F x (x) = P (X  ∈ (− ∞,  x]) =  P  (X ≤ x),  ∀x ∈ R

0
e obedece às seguintes propriedades:

seõçatona reV
1. Se x →   − ∞, então F x (x) → 0 . E se x → +∞, então F x (x) → 1 .

2. F x (x)  é contínua à direita.

3. F x (x)  é não decrescente.

Uma vez que sabemos o que é uma função de distribuição acumulada, podemos
calcular a função densidade de probabilidade. No entanto, devemos tomar cuidado
com essa função já que ela possui definições diferentes dependendo da natureza
da nossa variável aleatória. Por exemplo, se X é uma variável aleatória discreta,
então a função de probabilidade é definida como P (X = x) = F (x) − F (x + 1)

. Por outro lado, se X é uma variável aleatória contínua, então a função densidade
de probabilidade é descrita como f (x) = − ∂

∂x
F (x) . É importante destacar
também que o nome “função densidade de probabilidade” muda de acordo com a
natureza da variável aleatória justamente para diferenciar as duas, tudo bem?

Bom, definimos as duas funções fundamentais para determinar uma distribuição


de probabilidade. Vamos começar então? Iremos dividir as distribuições de
probabilidade em dois grupos: contínuas e discretas, iniciando-se pelas discretas.
Vale a ressalva que, neste texto, nosso enfoque será entender a equação da
distribuição, e não detalhá-la matematicamente.

A primeira distribuição de probabilidade discreta que vamos estudar é a


distribuição de Bernoulli. Essa distribuição, em particular, trata de uma variável em
que se observa apenas dois tipos de probabilidade: sucesso e fracasso.
Matematicamente, podemos defini-la como:

Distribuição de Bernoulli (MAGALHÃES, 2002): seja X uma variável aleatória


discreta com as seguintes características:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/12
04/08/22, 09:28 lddkls221_met_mat

x: Sucesso, se x  =  1

x: Fracasso, se x  =  0

Logo, a função de probabilidade que caracteriza X é descrita por

0
x 1−x
P (x) = ρ (1 − ρ)

seõçatona reV
A distribuição de probabilidade de X é conhecida como distribuição de Bernoulli
com parâmetro  e função de probabilidade dada pela expressão anterior. Se 
X~Bernoulli(ρ) , então E(X)  = ρ e V ar(X)  =  1  − ρ, em que E(X)
representa a média da distribuição e Var(X) a variância da distribuição.

A segunda distribuição discreta que vamos trabalhar é a distribuição binomial. Ela


é basicamente uma generalização da distribuição de Bernoulli, aqui estamos
interessados em n sucessos. Matematicamente, essa distribuição pode ser definida
como:

Distribuição Binomial (MAGALHÃES, 2002): seja X uma variável aleatória discreta,


tal que X conta o número de tentativas que resultam em um sucesso em n
tentativas. Nesse caso, a distribuição de probabilidade de X é conhecida como
distribuição binomial com parâmetro ρ e função de probabilidade caracterizada
por:
n
x
P (x) =   ( )ρ 1 − ρ ^ (n − x) 
x

em que 0  < ρ <  1. Se X~Bin(n, ρ), então E(X)  =  nρ e 


V ar(X)  =  nρ(1 − ρ) .

A terceira distribuição de probabilidade discreta mais famosa é a distribuição


geométrica, diferente das duas anteriores, nosso interesse aqui é trabalhar com o
número de fracassos até o primeiro sucesso. Matematicamente, ela pode ser
definida como:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/12
04/08/22, 09:28 lddkls221_met_mat

Distribuição geométrica (MAGALHÃES, 2002): seja X uma variável aleatória


discreta, tal que X conte o número de fracassos anteriores ao primeiro sucesso.
Nesse caso, a distribuição de probabilidade de X é conhecida como distribuição
geométrica com parâmetro ρ e tem função de probabilidade escrita na forma:

0
x
P (x)  = ρ(1 − ρ) ,  0  < ρ <  1

seõçatona reV
Se X~Geo(ρ), então E(X) = e V ar(X)  = .
1−ρ 1−ρ

ρ ρ2

Por fim, a última distribuição discreta que vamos abordar neste texto é a
distribuição de Poisson. Em comparação às outras três, a distribuição de Poisson
não lida com fracasso e sucesso, mas sim com número de eventos em um dado
intervalo de tempo. Matematicamente, essa distribuição pode ser definida como:

Distribuição de Poisson (MAGALHÃES, 2002): seja X uma variável aleatória


discreta, tal que X registre o número de eventos em um intervalo de tempo. A
distribuição de probabilidade de X é conhecida como distribuição de Poisson com
parâmetro λ e tem função de probabilidade escrita na forma:
−λ x
e λ
P (x) =
x!

Se X~P oisson(λ), então E(X) = V ar(X)  = λ.

Beleza, encerramos as distribuições de probabilidade discretas. Vamos então para


as distribuições de probabilidade contínuas. Vamos dar início ao estudos dessas
distribuições com a distribuição uniforme que trabalha com intervalos (a,b).
Matematicamente, essa distribuição é definida como:

Distribuição uniforme (MAGALHÃES, 2002): Dizemos que uma variável aleatória


contínua X é distribuída uniformemente ao longo do intervalo (a,b) se sua função
densidade de probabilidade é dada por:
1
f x (x) =
b−a

Nesse caso, se X~U (a, b), então E(X) = e V ar(X) = .


b+a (b−a)

2 12

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/12
04/08/22, 09:28 lddkls221_met_mat

Uma segunda distribuição de probabilidade contínua extremamente conhecida é a


distribuição beta, que é uma distribuição para lidar com dados no intervalo (0,1),
como taxas sanguíneas que estão limitadas a esse intervalo. As principais
aplicações dessa distribuição, em geral, são na área da saúde. Matematicamente,

0
podemos definir a distribuição beta como:

seõçatona reV
Distribuição beta (MAGALHÃES, 2002): dizemos que uma variável aleatória
contínua X segue uma distribuição beta com parâmetros a  > 0 e b  > 0 se sua
função densidade de probabilidade é dada por:
1 a−1 b−1
f x(x) = x (1 − x) ,  0  <  x  <  1
β(a,b)

em que β(a, b) é a função beta. Se X~Beta(a, b), então E(X) = a

a+b

V ar(X) = 2
(a+b) (a+b+1)
ab
.

Para encerrar nossos estudos sobre distribuições contínuas, vamos trabalhar com
três distribuições que são muito famosas, especialmente no contexto de teste de
hipóteses, que são as distribuições qui-quadrado, t de Student e normal. Essas
distribuições têm seus valores tabelados (que chamamos de Tabela da Normal,
Tabela do Qui-Quadrado, Tabela t de Student), o que facilita o cálculo das
probabilidades dessas distribuições. Mas o maior interesse nelas é, justamente,
quando lidamos com testes de hipóteses em que precisamos decidir sobre uma
hipótese (veremos mais sobre esses conceitos na Seção 3 desta unidade). Essas
distribuições são definidas, matematicamente, como:

Distribuição qui-quadrado (MAGALHÃES, 2002): uma variável aleatória contínua


X segue uma distribuição qui-quadrado com ν graus de liberdade se sua função
densidade for escrita na forma:
v x
1 ( )−1 −
f (x) = ν x 2
e 2
;   ν >  0, x  >  0
ν
2 2 Γ( )
2

Distribuição t de Student (MAGALHÃES, 2002): uma variável aleatória contínua X


tem distribuição t de Student com ν  graus de liberdade se sua função densidade
de probabilidade é dada por:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/12
04/08/22, 09:28 lddkls221_met_mat

ν+1
ν+1 −( )
Γ( ) 2 2
2 x
f x (x) = ν
(1 + )
√νπΓ( ) ν
2

Distribuição normal (MAGALHÃES, 2002): uma variável aleatória contínua X tem


distribuição normal com parâmetros −∞ < μ < ∞ e σ 2
> 0 se sua função

0
densidade de probabilidade for dada por:

seõçatona reV
x−μ 2
1
1 − ( )
f x (x) = e 2 σ

√ 2πσ 2

Assim, se X~N (μ, σ ), então E(X) = μ e V ar(X) = σ . Além disso, f


2 2
x (x) é
simétrica em relação à μ e quando μ = 0 e σ 2
= 1 , sua densidade se reduz a: 
1 2
1 − x
f (x) = e 2

√ 2π

e é conhecida como distribuição normal padrão. Nesse caso, dizemos que 


X~N (0,1) . Para transformar uma variável da distribuição normal para a
distribuição normal padrão, utilizamos a seguinte equação:
¯
x−μ
z =
σ

que é chamada de normalização padrão da variável e Z segue uma distribuição


normal padrão. Com isso, então, fechamos o nosso conteúdo sobre probabilidade
e distribuições de probabilidade. Agora é hora de colocar a mão na massa e
trabalhar com esses conceitos!

FAÇA VALER A PENA


Questão 1
Suponha que você esteja interessado em avaliar dois eventos: o primeiro sendo
tempo de exposição a metais pesados e o segundo sendo intoxicação por metais
pesados. Sendo então os eventos A: “tempo de exposição a metais pesados” e B:
“concentração do metal no sangue de 2 mg/L”, observou-se que P(A) = 0,2; P(B) = p;
P(A U B) = 0,5 e P(A ∩ B) = 0,1.

Assinale a alternativa correta.

a.  A probabilidade de a concentração do metal no sangue ser de 2 mg/L é P(B) = 0,3.

b.  A probabilidade de a concentração do metal no sangue ser de 2 mg/L é P(B) = 0,4.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/12
04/08/22, 09:28 lddkls221_met_mat

c.  A probabilidade de a concentração do metal no sangue ser de 2 mg/L é P(B) = 0,5.

d.  A probabilidade de a concentração do metal no sangue ser de 2 mg/L é P(B) = 0,2.

e.  A probabilidade de a concentração do metal no sangue ser de 2 mg/L é P(B) = 0,1.  

0
Questão 2

seõçatona reV
Seja X uma variável aleatória que representa a concentração de chumbo no sangue
para uma determinada população de homens no Brasil. Supondo que essa variável
tem distribuição normal com média de 129 mg/L, desvio-padrão de 19,8 mg/L e
que nosso interesse seja calcular a proporção de homens nessa população que
têm concentração de chumbo no sangue maior ou igual a 150 mg/L.

Assinale a alternativa correta.

a.  Nessa população, cerca de 19,5% dos homens têm concentração de chumbo no sangue maior ou igual a
150 mg/L.

b.  Nessa população, cerca de 14,5% dos homens têm concentração de chumbo no sangue maior ou igual a
150 mg/L.

c.  Nessa população, cerca de 4,5% dos homens têm concentração de chumbo no sangue maior ou igual a
150 mg/L.

d.  Nessa população, cerca de 34,5% dos homens têm concentração de chumbo no sangue maior ou igual a
150 mg/L.

e.  Nessa população, cerca de 24,5% dos homens têm concentração de chumbo no sangue maior ou igual a
150 mg/L. 

Questão 3
Suponha que você tenha interesse em investigar a probabilidade de um
trabalhador ser infectado por um agente tóxico e defina Y a variável aleatória que
corresponde a ser ou não infectado. Sabe-se que 30% dos trabalhadores expostos
a agentes tóxicos foram infectados, tal que P (Y = 1) = 0,30 e P (Y = 0) = 0,70

, em que 1 significa infectado e 0 significa não infectado. Suponha agora que temos
n observações para avaliar a probabilidade de sucesso e que nós selecionamos
uma amostra de 5 trabalhadores da população exposta ao agente tóxico.

Com base nesses dados, assinale a alternativa correta.


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/12
04/08/22, 09:28 lddkls221_met_mat

a.  A probabilidade de 2 desses trabalhadores estarem infectados é de 0,309.

b.  A probabilidade de 2 desses trabalhadores estarem infectados é de 0,109.

0
c.  A probabilidade de 2 desses trabalhadores estarem infectados é de 0,209.

seõçatona reV
d.  A probabilidade de 2 desses trabalhadores estarem infectados é de 0,409.

e.  A probabilidade de 2 desses trabalhadores estarem infectados é de 0,509. 

REFERÊNCIAS
HENRIQUES, C. Análise de regressão linear simples e múltipla. Departamento
de Matemática. Escola Superior de Tecnologia de Viseu. Portugal, 2011.

JUNIOR, P. J. R.; MAYER, F. P.; ZEVIANI, W. M. Probabilidade no R: Conceitos básicos


sobre distribuições de probabilidade. Universidade Federal do Paraná. Curitiba,
2015. Disponível em: http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-
02/ce083_aula7_2015-02.html. Acesso em: 13 abr. 2021.

MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. São


Paulo: Editora da Universidade de São Paulo, 2002.

NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.

VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/12
04/08/22, 09:28 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


PROBABILIDADE

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
Veja que o problema em questão envolve contagem e tempo, visto que são
acidentes anuais. Naturalmente, esse problema seria trabalhar com a questão de
sofrer ou não um acidente que remete à distribuição binomial, porém ela pode se
tornar complexa devido ao grande número de funcionários. Nesse caso,
trabalhamos com a aproximação da distribuição binomial para a distribuição de
Poisson, em que tiramos que o parâmetro λ é estimado por:

λ = np

Em que n é o número de trabalhadores e p é a probabilidade de um único


trabalhador se envolver em um acidente. Vamos supor que nessa empresa tenha
100.000 trabalhadores. Nesse caso, temos que:

λ = 100000 ⋅ 0,00024 = 24

Isso quer dizer que, em média, o número de trabalhadores envolvidos em


acidentes seria de 24 trabalhadores anualmente. Assumindo que a distribuição de
Poisson é recomendada para esses dados, temos que a probabilidade de nenhum
trabalhador sofrer acidente é descrita por:
(−24) 0
e 24
P (X = 0) = = 0,000000000003
0!

Ou seja, a chance de ninguém sofrer acidente é muito baixa. Agora, a chance de


mais do que 24 trabalhadores sofrer acidentes é descrita por:

P (X ≥ 24) = 1 − P (X < 24) = 1 − [P (X = 0) + P (X = 1) + … + P (X = 24)] = 0

Isto é, a chance de mais de 24 trabalhadores sofrerem acidentes nessa empresa é


de aproximadamente 44,6%. Conclusão, há poucas chances de um número X de
trabalhadores não sofrerem acidente, mas há uma chance muito grande de, acima

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:28 lddkls221_met_mat

de um limiar, muitos trabalhadores sofrerem acidente.

AVANÇANDO NA PRÁTICA

0
TESTE DE DIAGNÓSTICO

seõçatona reV
Suponha que você tenha sido contratado por uma empresa médica para avaliar a
eficácia de testes de diagnósticos de câncer de mama. Naturalmente, o interesse
da empresa é entender a probabilidade de uma mulher testar positivo para o
câncer quando ela realmente tem a doença e entender a questão do falso
negativo. Nesse aspecto, a empresa desenvolveu um novo tipo de teste e precisa
lidar com essas questões, mas eles não têm ideia de como começar e é aí que você
entra. Como você desenvolveria uma forma de avaliar a questão da mulher, de
fato, testar positivo quando ela tem câncer? Qual seria a base para sua fórmula?

RESOLUÇÃO 

Essa situação nos remete a trabalhar com o que chamamos de teorema de


Bayes. Como o interesse é verificar os falsos positivos e falsos negativos,
vamos chamar de A o evento em que a mulher tem câncer e B o evento em
que a mulher não tem câncer. Vamos também representar por T o teste
positivo. Nosso objetivo é calcular a probabilidade de ocorrer A dado que
ocorreu T, isto é, P (A ∣ T ), que significa a mulher ter câncer dado que o exame
foi positivo. A partir do teorema de Bayes, obtemos que:
P (A∩T ) P (A)P (T A)
P (AT ) = =
P (T ) P (A)P (T A)+P (B)P (T B)

Logo, essa fórmula iria descrever à empresa a relação entre os falsos positivos
e falsos negativos, com base no teorema de Bayes. Como exemplo de aplicação
da fórmula, podemos considerar P (A) = 0,2; P (B) = 0,8, tal que 
P (T A) = 0,75; P (T B) = 0,25 . Logo, a probabilidade de a paciente ter câncer,
dado que o exame é positivo, é dada por:
0,2⋅0,75
P (AT ) = = 0,4286
0,2⋅0,75+0,8⋅0,25

Isto é, de acordo com a nossa fórmula proposta para o teste de diagnóstico, a


probabilidade de a mulher ter câncer quando o exame é positivo é de 42,86%.
Em outras palavras, a cada 10.000 testes, 4.286 deles representam os
verdadeiros casos positivos nas condições do nosso exemplo.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:28 lddkls221_met_mat

0
seõçatona reV

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3
04/08/22, 09:29 lddkls221_met_mat

NÃO PODE FALTAR Imprimir

MÉTODOS DE TOMADA DE DECISÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
MÉTODOS DE TOMADA DE DECISÃO
Caro aluno, nesta seção iremos entender como fazemos para tomar uma decisão
com embasamento estatístico. Este é um dos tópicos mais importantes que você
irá estudar nesta unidade, visto que a tomada de decisões faz parte do nosso
cotidiano.

Como exemplo dessa abordagem, considere que você precisa decidir sobre a
eficácia de uma vacina. Após realizações de experimentos, você chega à seguinte
hipótese: “a vacina é eficaz?”. Para saber como responder essa pergunta, você deve
se basear em métodos estatísticos para fundamentar sua resposta, pois é com
base nessa experimentação que você vai decidir se a vacina é ou não eficaz.

Os níveis de colesterol, em geral, são indicadores de boa saúde. Em um dado


estudo envolvendo adultos hipertensos e fumantes, o pesquisador-chefe lhe
convidou para auxiliá-lo em um teste de hipóteses. Sabendo que o desvio-padrão
populacional é descrito por 46 mg/ml, o pesquisador deseja testar a hipótese de
que o nível médio de colesterol nessa população é de 211 mg/ml a partir de uma
amostra de 12 adultos hipertensos e fumantes que têm como nível médio de
colesterol cerca de 217 mg/ml ao nível de significância de 5%. Como você faria para
auxiliar esse pesquisador? Qual tipo de teste você recomendaria para testar a
hipótese dele? Qual seria o p-valor obtido no teste definido?

Que tal começar esse entendimento agora? Você será acompanhado em todo o
processo! Iniciaremos com os conceitos de hipóteses e, depois, passaremos para
os métodos estatísticos para a tomada de decisões.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 1/12
04/08/22, 09:29 lddkls221_met_mat

CONCEITO-CHAVE
Você já imaginou como são feitas as tomadas de decisões acerca de um
medicamento? De um júri? Ou até mesmo de um material de construção? Não?
Pois então, nesta seção iremos trabalhar com os métodos que fundamentam a

0
tomada de decisões com base em experimentação. Vamos começar com um

seõçatona reV
pequeno exemplo antes de definir as condições para tomar uma decisão.

Suponha que um certo indivíduo está sendo julgado por um certo crime.
Naturalmente, o júri precisa decidir sobre a culpa ou não desse indivíduo, com
base em fatos, testemunhas e leis. Nesse caso, então, duas hipóteses podem ser
formuladas:

H0: {o indivíduo é culpado}

H1: {o indivíduo é inocente}

A decisão por cada uma das hipóteses está sujeita a erros, é claro. Por exemplo, ao
tomar a decisão por H0, o júri pode cometer um erro, uma vez que o indivíduo
pode ser inocente. O mesmo vale se for tomada a decisão por H1. No entanto, na
prática, uma das decisões deve ser tomada, mesmo com essa possibilidade de se
cometer um erro. Então, sabendo das condições de erro, como fazemos para
tomar a decisão mais coerente? Antes de responder essa questão, vamos a
algumas definições importantes.

A primeira definição que vamos trabalhar é com a de hipótese estatística, que é a


base fundamental da tomada de decisões. Mas o que é uma hipótese estatística?
Ora, uma hipótese estatística nada mais é do que qualquer tipo de afirmação que
se faça sobre a distribuição de probabilidade de uma ou mais variável aleatória em
que H0 representa a hipótese nula e H1 a hipótese alternativa. Certo, mas você
deve estar se perguntando o que essa definição tem a ver com a questão exposta
sobre o júri, por exemplo. Veja que, embora não foi citado, a distribuição de
probabilidade no exemplo estava implícita. Em geral, trabalhamos com essas
distribuições implicitamente nas questões práticas, quando o assunto é tomar uma
decisão, isto é, elas funcionam, basicamente, como uma ferramenta.
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 2/12
04/08/22, 09:29 lddkls221_met_mat

Certo, sabemos o que é uma hipótese. Precisamos entender agora o que é um


teste de hipóteses. Em termos matemáticos, um teste de uma hipótese estatística
é uma função de decisão d :  X →  {a 0 ,  a 1 } , em que a corresponde à ação de
1

considerar a hipótese H0 como verdadeira,  corresponde à de considerar a

0
hipótese H1 como verdadeira e X é o espaço amostral associado à amostra 

seõçatona reV
X 1 ,   … ,  X n (CASELLA; BERGER, 2010). 

ASSIMILE

Como a função de decisão d divide o espaço amostral X em 


A 0 = {(x 1 ,   … ,  x n ) ∈  X;  d(x 1 ,   … ,  x n )  =  a 0 } e 
A 1 = {(x 1 ,   … ,  x n ) ∈ X;  d(x 1 ,   … ,  x n )  =  a 1 } , em que 
A0 ∪ A1 = X e A 0 ∩ A1 = ∅ , a região determinada pelo conjunto A é 0

chamada de região de aceitação, e a região determinada pelo conjunto A 1

é chamada de região de rejeição ou crítica (CASELLA; BERGER, 2010).

EXEMPLIFICANDO

Vamos considerar uma situação em que em uma caixa contenha duas


moedas e que uma delas apresenta cara com uma probabilidade π = 0,5 e
a outra apresenta cara com uma probabilidade π = 0,6. Supondo que uma
moeda é selecionada aleatoriamente e lançada três vezes, qual hipótese
poderíamos definir? Nesse caso, podemos definir nossa hipótese nula (ou
de pesquisa) como sendo H 0 : π = 0,5 e, como hipótese alternativa, a
hipótese H 1 : π = 0,6. 

Certo, temos as hipóteses, mas como escrevemos a região de aceitação e


região de rejeição que formam a base do teste de hipóteses? Para isso,
vamos trabalhar com a distribuição de probabilidade da situação ilustrada.
Logo, seja X a variável aleatória de Bernoulli que assume valor 1 se
i

ocorrer cara no i-ésimo lançamento, e o valor 0 caso contrário, i = 1,2,3.


Nesses termos, o espaço amostral X é descrito por:

X = {(0,0,0),  (1,0,0),  (0,1,0),  (0,0,1),  (0,1,1),  (1,0,1),  (1,1,0),  (1,1,1)}

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 3/12
04/08/22, 09:29 lddkls221_met_mat

Logo, podemos escrever a região de rejeição (ou crítica) para esse teste de
hipóteses como:

A 1 = {(x 1 ,  x 2 ,  x 3 );  x 1 +  x 2 +  x 3 ≥ 2}

0
de modo que a região de aceitação seja:

seõçatona reV
A 0 = {(x 1 ,  x 2 ,  x 3 );  x 1 +  x 2 +  x 3 <  2}.

Bom, agora sabemos o que é uma hipótese, um teste de hipótese e como


determinar a região crítica, porém, no início da seção falamos também sobre os
possíveis erros ao se tomar uma decisão. Temos dois tipos de erros a considerar: o
erro do tipo I e o erro do tipo II. O que significam esses erros? Ora, quando
rejeitamos a hipótese nula quando de fato ela é verdadeira, estamos cometendo o
que chamamos de erro do tipo I. Por outro lado, quando não rejeitamos a hipótese
nula quando de fato ela é falsa, estamos cometendo erro do tipo II (CASELLA;
BERGER, 2010). No geral, denotamos as probabilidades desses dois tipos de erro
como α e β, respectivamente.

Outro fator importante quando trabalhamos com testes de hipóteses é a função


de risco, que vai determinar para nós a probabilidade dos erros do tipo I e tipo II.
Mas antes de trabalhar com essa função, precisamos de uma definição da função
de perda, que é a seguinte:

Definição (CASELLA; BERGER, 2010): sejam H 0 :  θ  = θ , H 1 : θ  = θ e a 0 1

função de perda definida por:

l(θ i ,  d)  =  0  se a decisão for correta

l(θ i ,  d)  =  1  se a decisão for incorreta

Agora sim podemos trabalhar com a função de risco. Nesse caso, a função de risco
que determina a probabilidade dos erros do tipo I e II, com base na função de
perda, é dada por:

R(θ i ,  d)  =  E[l(θ i ,  d)]  =  P (X ∈  A 0 ∣ θ 1 )  = β  (Erro do Tipo I)

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 4/12
04/08/22, 09:29 lddkls221_met_mat

R(θ i ,  d)  =  E[l(θ i ,  d)]  =  P (X ∈  A 1 ∣ θ 0 )  = α  (Erro do Tipo II)

Em que E representa o valor esperado (ou média).

Certo, vimos muitas componentes sobre os testes de hipóteses, mas ainda faltam

0
duas que são as mais usuais de aparecerem nos trabalhos científicos e nos

seõçatona reV
trabalhos diários envolvendo testes de hipóteses: o nível de significância nominal e
o nível descritivo do teste (ou p-valor). Vamos entender esses conceitos pelas
definições a seguir:

Nível de significância nominal de um teste de hipótese (CASELLA; BERGER,


2010): é caracterizado pela probabilidade de se cometer o erro do tipo I. Em
grande parte dos estudos, adota-se, em geral, o nível de significância α = 0.05.

Nível descritivo do teste, ou p-valor (CASELLA; BERGER, 2010): traduz a


probabilidade de que a estatística do teste (como variável aleatória) tenha valor
extremo em relação ao valor observado (estatística) quando a hipótese nula é
verdadeira. Em outras palavras, sob o ponto de vista matemático, considere um
teste de hipóteses no qual R   é a região de rejeição com nível de significância α e
α

suponha que, para diferentes valores de α, as regiões R e R α α1 satisfazem 


R α ⊂ R α1 com α < α . Dessa forma, sob essas condições, o p-valor é definido
1

por:

p  =  p(X) = inf {α :  X ∈  R α }

em que X representa a amostra aleatória e inf é o ínfimo do conjunto. 

É importante destacar que com essa definição de p-valor, podemos reescrever a


nossa definição anterior de região a fim de definir o que é poder do teste, que é
um dos conceitos mais importantes quando se trabalha com teste de hipóteses.
Nesse caso, o poder do teste pode ser definido como:

Definição (CASELLA; BERGER, 2010): o poder do teste com região crítica A para 1

testar H 0 : θ = θ contra H 1 : θ = θ é descrito por:


0 1

π(θ 1 ) = P H 1 (X ∈  A 1 ) = P (X ∈  A 1 ∣ θ 1 )  =  1  − β

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 5/12
04/08/22, 09:29 lddkls221_met_mat

em que β é a probabilidade do erro do tipo II.

EXEMPLIFICANDO

Considere uma amostra aleatória de tamanho n, X 1,   … ,  X n , da

0
distribuição da variável aleatória X~ N (μ,  1). Suponha que você tem

seõçatona reV
interesse em testar as hipóteses H 0 : μ = 0 e H 1 : μ = 1, tal que a região
A 1 = {x : x ≥ c}
¯ n  =  16 α = 0,05 crítica seja  . Sabendo que  e  , como
encontramos o valor de c? Nesse caso, podemos encontrar o valor de c pela
equação:

¯
0,05 =  P H 0 (X ≥ c)  =  P (Z ≥  c√n)

em que Z é a transformação da variável X para a distribuição normal


¯
X √ n~ N (0,1) padrão, isto é,  . Assim, com base na distribuição normal
padrão obtemos que c√n  =  1,64, isto é, c  =  0.41 tal que a região
A 1   =  {x : x ≥  0,41}
¯ crítica para esse teste seja  .

Agora já sabemos trabalhar com testes de hipóteses! Antes de ir para os tipos de


testes mais comuns da prática cotidiana, vamos trabalhar com mais três conceitos
para fechar esse aparato teórico. Tais conceitos são: hipótese simples, teste ótimo
e, finalmente, o lema de Neyman-Pearson. O lema de Neyman-Pearson é o que nos
assegura a construção de qualquer tipo de teste de hipóteses, isto é, é o resultado
mais importante e fundamental desse contexto teórico. Mas vamos começar com a
hipótese simples.

Hipótese simples (CASELLA; BERGER, 2010): considere X 1,   … ,  X n uma


amostra aleatória tomada de uma dentre duas possíveis distribuições. Se o espaço
paramétrico Θ contém apenas dois pontos, θ e θ , então, para decidir de qual 0 1

distribuição a amostra provém, utiliza-se um teste de hipótese simples, no qual


suas hipóteses são definidas como:

H 0 : θ  = θ 0 ;  H 1 : θ = θ 1

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 6/12
04/08/22, 09:29 lddkls221_met_mat

em que θ é o parâmetro da primeira distribuição e θ o parâmetro da segunda


0 1

distribuição. Esse tipo de hipótese considera o que chamamos de teste bicaudal.

A partir dessa definição e da definição da função de verossimilhança de uma

0
distribuição de probabilidade (ver Casella; Berger, 2010), podemos definir o
conceito de teste ótimo.

seõçatona reV
Teste ótimo (CASELLA; BERGER, 2010): considere o teste com região crítica
descrita por:
* L 1 (x) a
A   = {x; ≥ }
1 L 0 (x) b

em que L 1 (x)  = ∏
n

i = 1
f (x i θ 1 ),  L 0 (x)  = ∏
n

i = 1
f (x i ∣ θ 0 ) , a e b > 0 são
especificados. Então, para qualquer outro teste com região crítica A , tem-se que: 1

* *
aα(A 1 ) +  bβ(A 1 ) ≤  aα(A 1 ) +  bβ(A 1 )

isto é, a hipótese H0 será rejeitada quando a razão de verossimilhança,  ,é


L 1 (x)

L 0 (x)

necessariamente pequena.

Agora, com as definições de hipótese simples e teste ótimo, temos as ferramentas


necessárias para enunciar o lema de Neyman-Pearson, que é um dos resultados
mais importantes quando se fala de teste de hipóteses.

Neyman-Pearson (CASELLA; BERGER, 2010): considere o teste com região crítica


descrita por:
* L 1 (x)
A 1   =  {x; ≥  k}
L 0 (x)

em que L . Então A é a
n n *

1 (x)  = ∏ i = 1
f (x i θ 1 ),  L 0 (x)  = ∏
i = 1
f (x i ∣ θ 0 )
1

melhor região crítica de nível α = α(A para testar H 0 : θ = θ contra 


*

1
) 0

, isto é, β(A para qualquer outro teste A com 


*
H 1 : θ = θ1 ) ≤ β(A 1 ) 1
1

α(A 1 ) ≤ α .

Encerramos então a nossa primeira parte desta seção, que era a parte teórica a
respeito dos testes de hipóteses. Agora, vamos trabalhar com alguns testes
comuns na prática. O primeiro que iremos trabalhar é o teste Z.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 7/12
04/08/22, 09:29 lddkls221_met_mat

O teste Z para média é um teste estatístico baseado na distribuição normal para


amostras grandes e desvio-padrão conhecido. Nesse caso, a estatística do teste é
descrita por:

0
¯
x− μ 0
Z calc =
σ/√n

seõçatona reV
para testar a hipótese H 0 : μ = μ contra H 1 : μ ≠ μ (teste bicaudal) ou 
1 1

H 0 : μ ≥ μ 1 (μ ≤ μ 1 ) contra H 1 : μ <  μ 1 (μ > μ1 ) (teste unicaudal). Nesse


caso, para trabalhar com o p-valor, trabalhamos com a tabela da distribuição
normal de acordo com o nível de significância do teste. Em situações que temos
duas populações, temos a versão do teste Z para duas médias, cuja estatística do
teste é dada por:
¯
¯
x−y
Z calc =
2 2
σx σ
y
√  − 
nx ny

O teste Z é um dos testes mais simples que temos para fazer comparação de
médias, porém ele pode ser ruim quando trabalhamos com amostras muito
pequenas e não aplicável quando não conhecemos o valor do desvio-padrão
populacional. E como resolvemos se isso acontecer? Ora, nesse caso, temos um
teste análogo ao teste Z, que é o teste t baseado na distribuição t de Student. Esse
teste é utilizado, em geral, quando não conhecemos o valor do desvio-padrão
populacional e a amostra é pequena. A estatística do teste é dada por:
x− μ 0
¯
t calc =
s/√n

Além disso, podemos testar os mesmos tipos de hipóteses anteriores para o teste
bicaudal e unicaudal. E quando temos duas médias, podemos trabalhar também
com o teste t? Sim, podemos, porém há uma diferença em relação ao teste Z.
Nesse caso, temos duas considerações: variâncias iguais e variâncias diferentes. No
caso em que elas são iguais, a estatística do teste é dada por:
¯
¯
(X − Y )−(μ 1 −μ 2 )

T calc =
1 1
sp √ +
n n
1 2

E no caso em que elas são diferentes, a estatística do teste é dada por:

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 8/12
04/08/22, 09:29 lddkls221_met_mat

¯
¯
(X − Y )−(μ 1 −μ 2 )

T calc =
2 2
s s
√ 1
+
2

n n
1 2

Agora já sabemos como testar a média. Mas esse é o único tipo de teste que pode

0
ser feito? Não, podemos trabalhar também com testes de proporção, além de
outras medidas. Neste texto, nosso foco serão os testes de média e de proporção.

seõçatona reV
Então, para encerrar nossa seção, vamos considerar o teste para proporção, que é
baseado no teorema central do limite e no teste Z, com estatística de teste dada
por:
p̂−p
Z calc =
p(1−p)

n

Como exemplo de aplicação desse teste, podemos testar hipóteses do tipo “um
engenheiro garante que 95% dos seus projetos estão de acordo com as normas da
ABNT” ou “uma empresa garante que é responsável por apenas 10% da
contaminação de um determinado lago”, e assim por diante. E para duas
proporções, também conseguimos trabalhar com esse teste? Sim, nesse caso, a
estatística do teste é dada por:
ˆ
p 1 −ˆ
p2
Z calc =
p̂(1−p̂) p̂(1−p̂)
√  − 
n n
1 2

em que p̂ é obtido pela média ponderada de ˆ


p e p , isto é, 1 2

n 1ˆ
p 1 +n 2 ˆ
p2
p̂ =
n 1 +n 2

REFLITA

No caso de proporções, você acha que é possível trabalhar com o teste t em


vez do teste Z? Se sim, como você acha que ficaria a estatística do teste?

Com isso fechamos o nosso conteúdo sobre testes de hipóteses, que são
ferramentas fundamentais para lidar com a tomada de decisões. Agora é hora de
colocar a mão na massa e trabalhar com esses conceitos.

FAÇA VALER A PENA


https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId… 9/12
04/08/22, 09:29 lddkls221_met_mat

Questão 1
Suponha que a concentração média de nitrogênio amoniacal encontrado em um
determinado lago brasileiro no ano passado seja de 15,4 mg/L. Em uma amostra
de tamanho 35, isto é, 35 observações das concentrações de nitrogênio amoniacal

0
nesse ano do mesmo lago, a concentração média de nitrogênio amoniacal foi de

seõçatona reV
14,6 mg/L. Sabendo que o desvio-padrão da população seja de 2,5 mg/L e o nível
de significância 0,05, temos interesse em achar o p-valor para saber se rejeitamos
ou não a hipótese nula.

Nessas condições, assinale a alternativa correta.

a.  O p-valor em questão é 0,0892.

b.  O p-valor em questão é 0,2453.

c.  O p-valor em questão é 0,0583.

d.  O p-valor em questão é 0,0120.

e.  O p-valor em questão é 0,0378. 

Questão 2
Em uma determinada cidade pequena, um surto de uma determinada doença
afetou os níveis de hemoglobina no sangue, que reduziu a resposta imunológica
do corpo no combate à doença. Os cientistas mediram o nível de hemoglobina em
nove pacientes selecionados aleatoriamente naquela cidade. Os níveis (em NMP/g)
foram os seguintes: 0.593, 0.142, 0.329, 0.691, 0.231, 0.793, 0.519, 0.392, 0.418.
Com base nesses dados, existe evidência de que o nível médio de hemoglobina no
sangue é igual a 0,7 NMP/g ao nível de significância de 5% nessa população?

Assinale a alternativa correta.

a.  Com o p-valor, p  =  0,089 >  0,05, não rejeitamos H0, concluindo assim que não há evidências de que o
nível médio de hemoglobina no sangue dessa população é igual a 0,7 NMP/g.

b.  Com o p-valor, p  =  0,089 >  0,05, não rejeitamos H0, concluindo assim que há evidências de que o
nível médio de hemoglobina no sangue dessa população é igual a 0,7 NMP/g.

c.  Com o p-valor, p  =  0,089 >  0,05, rejeitamos H0, concluindo assim que não há evidências de que o
nível médio de hemoglobina no sangue dessa população é igual a 0,7 NMP/g.
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 10/12
04/08/22, 09:29 lddkls221_met_mat

d.  Com o p-valor, p  =  0,089 >  0,05, rejeitamos H0, concluindo assim que não há evidências de que o
nível médio de hemoglobina no sangue dessa população é igual a 0,7 NMP/g. 

e.  Com o p-valor, p  =  0,089 >  0,05, não rejeitamos H0, concluindo assim que há evidências de que o
nível médio de hemoglobina no sangue dessa população é igual a 0,7 NMP/g.  

0
seõçatona reV
Questão 3
Suponha que você tem dois tipos de ferragens para a construção de um prédio e
que teu objetivo seja comparar a altura das ferragens, visando a economia na
compra do material e assumindo um nível de significância de 5%. O tipo (A)
consiste em ferragem de cobre, com variância da população igual a 5 cm, e o grupo
(B) consiste em ferragem de aço, com variância da população igual a 8,5 cm.
Selecionando duas amostras, você obteve as seguintes alturas (em cm):

Grupo A: 175, 168, 168, 190, 156, 181, 182, 175, 174, 179

Grupo B: 185, 169, 173, 173, 188, 186, 175, 174, 179, 180

Com base nessas informações, é necessário realizar um teste para comparação de


médias.

Sabendo que será utilizado o teste Z para isso, assinale a alternativa correta.

a. O valor da estatística z para o teste de comparação de duas médias é z = −1,9263.

b. O valor da estatística z para o teste de comparação de duas médias é z = 2,9263.

c. O valor da estatística z para o teste de comparação de duas médias é z = −2,9263.

d. O valor da estatística z para o teste de comparação de duas médias é z = 1,9263.

e. O valor da estatística z para o teste de comparação de duas médias é z = −3,9263. 

REFERÊNCIAS
CASELLA, G.; BERGER, R. L. Inferência Estatística. São Paulo: Cengage Learning
Brasil, 2010.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 11/12
04/08/22, 09:29 lddkls221_met_mat

HENRIQUES, C. Análise de regressão linear simples e múltipla. Departamento


de Matemática. Escola Superior de Tecnologia de Viseu. Portugal, 2011.

MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. São

0
Paulo: Editora da Universidade de São Paulo, 2002.

seõçatona reV
NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.

SOUZA, N. Visualização de dados e testes de hipóteses com R: uma


breve    abordagem prática. Universidade Aberta do Brasil, 2018. Disponível em:
https://repositorioaberto.uab.pt/bitstream/10400.2/5952/10/R_text_v9_ReposAb.pd
f. Acesso em: 14 abr. 2021.

VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeI… 12/12
04/08/22, 09:29 lddkls221_met_mat

Imprimir

FOCO NO MERCADO DE TRABALHO


MÉTODOS DE TOMADA DE DECISÃO

0
Ricardo Puziol de Oliveira

seõçatona reV
SEM MEDO DE ERRAR
A primeira coisa que devemos analisar é se o teste será unicaudal ou bicaudal. Na
situação exposta, notemos que o nível médio de colesterol da subpopulação de
hipertensos e fumantes pode ser maior ou menor do que o nível médio de
colesterol considerado na hipótese de teste, então, nossa hipótese alternativa é
descrita por:

H 1  =  μ ≠ 211 mg/ml

Isto é, estamos considerando um teste bicaudal nas condições do problema. A


segunda observação que devemos ter em mente é de que o tamanho da amostra
considerada é pequeno, o que nos indica que o teste t seria apropriado. No
entanto, devemos notar também que o desvio-padrão populacional é conhecido,
nossa terceira observação. Então, nesse caso, podemos utilizar o teste Z. Assim,
após esses critérios, podemos recomendar ao pesquisador o uso do teste Z, que é
baseado na estatística:
¯
x− μ0
Zcalc =
σ/√n

Que, usando os dados do nosso problema, é dado por:


217− 211
Zcalc = = 0,45
46/√ 12

Nesse caso, como Z segue a distribuição normal padrão, temos que o p-valor, ao
nível de significância de 5% e com base na tabela da distribuição normal para teste
bicaudal, é igual a 0,652. Como esse valor é maior do que 0,05, não rejeitamos a
https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 1/3
04/08/22, 09:29 lddkls221_met_mat

hipótese nula (ou de pesquisa). Ou seja, podemos concluir ao pesquisador que,


baseado nessa amostra, não há evidências de que o nível médio de colesterol
dessa população de fumantes hipertensos seja diferente de 211 mg/ml.

0
AVANÇANDO NA PRÁTICA

seõçatona reV
POLUIÇÃO ATMOSFÉRICA
Suponha que você foi convidado por uma empresa para trabalhar com níveis de
gases poluentes em uma determinada cidade. Sabendo que o principal gás
poluente é o CO2 e que o desvio-padrão populacional é de 0,85 mg/L, a empresa
deseja saber se a concentração média de CO2 é maior ou igual à concentração
média dos gases poluentes descrita por 12,29 mg/L, considerando uma amostra de
tamanho 74 com média igual a 10,6 mg/L e um nível de significância de 5%. Sendo
assim, qual teste de hipóteses você utilizaria para essa situação? E como você
apresentaria seus resultados à empresa?

RESOLUÇÃO 

Inicialmente, devemos verificar que tipo de teste vamos utilizar, bicaudal ou


unicaudal. Para verificar isso, vamos construir nossas hipóteses. Nesse caso, a
hipótese nula é dada por:

H 0 : μ ≥ 12,29 mg/L

O que nos implica que a hipótese alternativa é:

H 1 : μ < 12,29 mg/L

Ou seja, temos um teste unicaudal. Agora, como o tamanho da amostra é


grande e conhecemos o desvio-padrão populacional, podemos trabalhar com o
teste Z. Nesse caso,
¯
x− μ0
Zcalc =
σ/√ n

Que, usando os dados do nosso problema, é dada por:


10,6− 12,29
Zcalc = = −17,10
0 85/√ 74

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 2/3
04/08/22, 09:29 lddkls221_met_mat

0,85/√ 74

Como o teste é unicaudal, vamos trabalhar com a área à esquerda de z calc que,
nesse caso, é menor do que 0,001. Isto é, assumindo nosso nível de
significância de 5%, temos que o p-valor é dado por  e, portanto, rejeitamos H0.

0
Assim, concluímos que que o nível médio de CO  é menor que o nível médio 2

seõçatona reV
dos gases poluentes. Em outras palavras, na conclusão para a empresa,
podemos apresentar que não há evidências de que o nível médio de CO  seja 2

igual ou superior a 12,29 mg/L naquela cidade.

https://www.colaboraread.com.br/integracaoAlgetec/index?usuarioEmail=lucas21mello%40outlook.com&usuarioNome=LUCAS+COSTA+DE+MELLO&disciplinaDescricao=MÉTODOS+MATEMÁTICOS&atividadeId=… 3/3

Você também pode gostar