Escolar Documentos
Profissional Documentos
Cultura Documentos
Avançadas
Apresentação
Análise de Regressão
Na regressão linear simples, por exemplo, pode-se deduzir e
analisar a reta que melhor explique a relação linear entre duas
Fontes: Estatística Usando Excel, J.C. Lapponi, 2005 e suporte Microsoft amostras ou variáveis aleatórias, com definição prévia da variável
independente e da variável dependente
Todos os dias a mídia se encarrega de informar resultados de
análises e pesquisas do tipo:
O valor da empresa depende do lucro futuro
A taxa de juros depende da inflação
PLANILHAS AVANÇADAS O salário depende da escolaridade do trabalhador
Disciplina de Núcleo Livre para Engenharias Etc.
Prof. Ricardo Rezende, D.S.
O objetivo da análise de regressão é encontrar uma função que Uma linha de tendência linear é
permita: a linha reta que melhor se adapta
Descrever e compreender a relação entre uma variável e é utilizada com conjuntos de
dependente e uma ou mais variáveis independentes; dados lineares simples
Projetar ou estimar uma variável em função de uma ou mais Os dados são lineares se o
variáveis independentes; por exemplo: as vendas para padrão nos seus pontos de dados
diferentes valores de investimento em propaganda, a demanda parecer uma linha
em função do preço unitário e do investimento em Uma linha de tendência,
propaganda, etc. normalmente, mostra que algo as vendas aumentaram de forma
Esta aula apresentará formas práticas de ajustar e obter equações está a aumentar ou a diminuir consistente ao longo de 13 meses
de regressão usando o comando Linha de Tendência do Excel num ritmo estável
O objetivo do diretor de vendas de uma rede de varejo é analisar Para analisar a relação entre as duas variáveis, os dados foram
a relação entre o investimento realizado em propaganda e as registrados no Excel e um gráfico de dispersão das vendas anuais
vendas das lojas da rede, para realizar projeções de vendas de em função do investimento anual em propaganda foi construído
futuros investimentos em propaganda. A tabela a seguir registra
uma amostra representativa extraída dos registros históricos das
lojas de tamanho equivalente, com os valores de Propaganda e
Vendas em milhões:
Propaganda 30 21 35 42 37 20 8 17 35 25
Vendas 430 335 520 490 470 210 195 270 400 480
Para usar o comando Linha de Tendência: Será exibida uma
Selecione a trajetória dos pontos no gráfico de dispersão; os pontos caixa de diálogo:
do gráfico mudarão de cor; Selecione Tipo de
Escolha Adicionar Linha de Tendência... Tendência/
Regressão
Linear
Selecione Exibir
Equação no
gráfico e Exibir
valor de R-
quadrado no
gráfico
O resultado dos procedimentos anteriores pode ser observado Com a equação y = 9,738x + 117,0 será possível representar o
na figura abaixo: comportamento das vendas em função do investimento em
propaganda com um modelo linear e realizar projeções
Observa-se que o coeficiente de determinação r2 é definido
como a relação que mede a proporção da variação total da
variável dependente que é explicada pela variação da variável
independente; este valor varia entre 0 e 1; quanto maior for o r2
melhor será o poder de explicação da reta de regressão
Por outro lado, para projetar valores de y, deve-se tomar o
cuidado de escolher valores de x dentro do intervalo de valores
da amostra independente x
Utilizando a reta de regressão anterior, projete as vendas para O programador de produção gostaria de utilizar um modelo de
investimentos em propaganda de 20, 30 e 45 milhões regressão linear para realizar previsões de demanda e conseguir
estabelecer as quantidades de produção requeridas para atender a
essas previsões. Os dados históricos disponíveis na empresa
relacionam as vendas com o dispêndio em propaganda como
mostra a tabela seguinte, ambos os valores monetários na mesma
escala. Determine a equação da reta de regressão. Este modelo
pode ser usado para representar os dados históricos?
Construa a reta de regressão linear com os retornos das ações A linha de tendência
PN em função dos retornos das ações ON a partir das amostras exponencial é uma linha
registradas na tabela seguinte: curva utilizada quando os
valores de dados aumentam
ou diminuem em
percentagens cada vez mais
ON% 37,5 -45 0 31,5 -1 20,1 221,5 46,3 11,1 43 67 9,4
elevadas
PN% 20,9 5,4 49,4 31,1 30 28 367,1 6,9 45,4 27,8 43,1 13,4
Não é possível criar uma
linha de tendência
exponencial se os dados
PN = 1,3767ON + 5,0675 incluírem zero ou valores diminuição do teor de carbono 14 à
negativos medida que um objeto envelhece
A pressão atmosférica pode ser obtida por meio altitude Uma linha de tendência
Altitude Pressão atm Pressão atm
logarítmica é a linha curva
m kgf/cm2 kgf/cm2, est. Pressão atmosférica = f (altitude) que melhor se adapta e é
100
1,021 1,034
200
1,008 1,023
1,200
utilizada quando a
300
0,996 1,013
400
0,985 1,003
1,000
y = 1,0448e-1E-04x percentagem de alteração
500
0,973 0,993
R² = 0,99903
600
0,960 0,983
dos dados aumenta e
700
0,948 0,973
0,800
diminui rapidamente e, em
kgf/cm2
A altitude pode ser obtida por meio da pressão atmosférica Uma linha de tendência de
Pressão atm Altitude Altitude
potência é uma linha curva,
kgf/cm2 m m, estimada Altitude = f (pressão atmosférica) mais útil com conjuntos de
1,021 100
177,3
1,008 200
274,1
12000
dados que comparam
0,996 300
364,6
0,985 400
448,5
10000
y = -7555ln(x) + 334,34 medidas que aumentam a
0,973 500
541,1
R² = 0,99903
0,960 600
642,8
uma taxa específica, por
0,948 700
737,8
8000
0,936 800
834,0
exemplo, a aceleração de um
900
923,3
6000
m
0,925
0,915
1000
1005,5
carro de corrida em
0,810
2000
1926,3
4000
0,715
3000
2868,8
intervalos de um segundo; os
0,629
4000
3837,0
2000
0,552
5000
4823,6
dados não podem apresentar
0,481
6000
5863,8
0 aumento da aceleração
0,419
0,363
7000
8000
6906,3
7990,2
0,000 0,200 0,400 0,600 0,800 1,000 1,200 o valor 0 ou valores
0,313
0,270
9000
10000
9109,9
10226,4
kgf/cm2 negativos
A população mundial continua sua escalada de altas taxas de A linha de tendência de média móvel suaviza as flutuações dos
crescimento; os dados abaixo ilustram esta situação, no período dados, de modo a mostrar um padrão ou uma tendência com
de 1950 a 2005, e podem ser representado por uma linha de maior clareza
tendência de potência Uma média móvel utiliza um número específico de pontos de
Ano
População
mundial
Evolução da população mundial dados (definido pela opção Período), calcula a respectiva média e
1950
Real
Es3mada
2.518.629
2.737.412
8.000.000 utiliza o valor da média como um ponto na linha
7.000.000
1955
2.755.823
2.991.319
y = 3E-108x34,638
1960
3.021.475
3.268.038
6.000.000 R² = 0,9963 Por exemplo, se o Período k estiver definido como 2, a média
1965
3.334.874
3.569.550
5.000.000
1970
3.692.492
3.898.005
4.000.000
dos dois primeiros pontos de dados é utilizada como primeiro
1975
1980
4.068.109
4.255.734
4.434.682
4.645.261
3.000.000
2.000.000
ponto da linha de tendência de média móvel
1985
4.830.979
5.069.322
1990
5.263.593
5.530.878
1.000.000
Real Power (Real) A média do segundo e terceiro pontos de dados é utilizada como
0
1995
2000
5.674.380
6.033.140
6.070.581
6.579.581
1940 1950 1960 1970 1980 1990 2000 2010 o segundo ponto da linha de tendência, e assim sucessivamente
2005
6.453.628
7.173.962
A tabela abaixo registra a projeção das vendas diárias de uma A linha de tendência polinomial é uma linha curva utilizada
empresa, em milhares, durante os últimos 12 meses, com a quando há flutuação de dados
análise da média móvel, com k = 3, podendo-se visualizar a linha É útil, por exemplo, para analisar os ganhos e as perdas de um
de tendência conjunto de dados de grande dimensão
t Vendas k=3
Gráfico das vendas em 12 meses A ordem da polinomial pode ser determinada pelo número de
1 295
2 305 320
flutuações de dados ou pela quantidade de oscilações (máximos e
3 316
4 298 305,3
315
310
mínimos) da curva
5 305 306,3
6 310 306,3 305 Normalmente, uma linha de tendência polinomial número 2 tem
7 316 304,3
8 306 310,3 300 apenas um máximo ou mínimo
9 301 310,7
10 295 307,7
295
Por norma, a número 3 tem um ou dois máximos ou mínimos
290
11 312 300,7
12 308 302,7
0 1 2 3 4 5 6 7 8 9 10 11 12 13
A número 4 pode ter três máximos ou mínimos.
Vendas 3 per. Mov. Avg. (Vendas)
13 305,0
O gerente de projeto de um novo motor realizou testes de Segundo o Suporte da Microsoft, ao adicionar uma linha de
consumo de combustível em função da velocidade do protótipo tendência polinomial a equação exibida no gráfico pode estar
de carro que utilizará este motor. incorreta (você substitui os valores de x e não dá certo para y)
Ajuste a curva polinomial adequada aos dados registrados na Isto é mais perceptível quando se trabalha com um gráfico de
planilha abaixo dispersão (xy) e os valores de x estão bem próximos ao seu
Velocidade Consumo
tamanho absoluto (isto é, o intervalo de x é < 20% do valor
13
km/hora km/litro 12 médio de x)
60 9,5 12
70 10,2 11 Sugestões para contornar o problema:
80 10,9 11
km/l
90 11,5 10
10
Usar pelo menos 5 pontos de dados para a série;
100 12,1 y = -0,0017x2 + 0,3288x - 4,4076
110 11,8
9
9
R² = 0,93892 Usar polinomiais de 2ª ou 3ª ordem, no máximo, e
120 10,6
130 9,8
8
50 60 70 80 90 100 110 120 130 140 150 Formatar a equação para a categoria números, com mais casas
km/h
140 8,9 decimais
Exercícios Exercícios
1. Refaça os exercícios resolvidos com a linha de tendência linear 3. Os gráficos ao lado
utilizando, se possível, as demais linhas de tendência estudadas representam a evolução das
nesta aula chocolaterias Cacau Show,
no período de 2006 a 2011
(Fonte: Revista Exame PME,
2. O analista de custos da empresa preparou a tabela a seguir que Edição 45, janeiro/2012)
registra o custo médio para diversas quantidades produzidas. O a) Reproduza-os;
objetivo do analista é dispor de um modelo que projete valores b) Obtenha linhas de
do custo médio em função da quantidade produzida. Obtenha tendências, com o melhor
o gráfico de dispersão e a melhor função de projeção ajuste de R2 possível e;
c) Apresente previsões para
q 1,00 2,00 3,20 4,20 5,20 6,20 7,20 8,20 9,50 10,50 12,00 14,00
CM 5,735 4,900 4,500 4,110 4,135 4,035 4,305 4,650 5,143 5,765 6,582 8,500
2012.