Você está na página 1de 33

MBA em Gesto de Projetos e Processos Organizacionais

Estatstica Aplicada
Galo Lopez Noriega galo.noriega@trevisan.edu.br
1

Regresso Linear Simples


Levine: Captulos 11 e 12 Anderson: Captulo 12
2

Alguns Exemplos
Aumento das vendas de acordo com a incidncia de anncios na TV em horrio nobre; Receita do Hotel Bellagio em Las Vegas de acordo com o nmero de shows feitos pelo Cirque du Soleil; Coerncia das dedues feitas pelos contribuintes em relao sua receita bruta; Aumento do consumo de energia eltrica devido ao crescimento do uso de computadores; Taxas especiais em hotis para quem viaja negcios; Taxa de desemprego e taxa de criminalidade.
3

Previso de Vendas

Andreia a Diretora de Novos Negcios da AL&O, uma empresa da rea de varejo. A AL&O lanou um nova linha de produtos no mercado. Esta nova linha de produtos foi lanado inicialmente em algumas de suas unidades no nordeste norte americano, fazendo uso de campanhas publicitrias (a tabela a seguir mostra os gastos em publicidade e os valores das vendas).

Data da Introduo Ms ano Janeiro 1994 Fevereiro 1994 Maro 1994 Abril 1994 Maio 1994 Junho 1994 Julho 1994 Agosto 1994 Setembro 1994 Outubro 1994 Novembro 1994 Dezembro 1994 Janeiro 1995 Fevereiro 1995

Regio Maine New Hampshire Vermont Massachusetts Connecticut Rhode Island New York New Jersey Pennsylvania Delaware MaryLand Wet Virginia Virginia Ohio

Gastos (milhes) Publicidade $1,80 $1,20 $0,40 $0,50 $2,50 $2,50 $1,50 $1,20 $1,60 $1,00 $1,50 $0,70 $1,00 $0,80

Vendas ( milhes) Primeiro ano $104,00 $68,00 $39,00 $43,00 $134,00 $127,00 $87,00 $77,00 $102,00 $65,00 $101,00 $46,00 $52,00 $33,00
5

Andreia est interessada em analisar estes dados para determinar quais sero as vendas em duas novas regies nas quais as verbas para Publicidade so de US$ 2,0 milhes. Com base nas informaes fornecidas gostaramos responder as seguintes questes:

1) Qual a relao entre a publicidade e as vendas? 2) Qual o valor estimado para as vendas em regies nas quais se pretende investir $2,0 milhes? 3) Quo confiveis so estes valores estimados?
6

Primeiro vamos desenhar o grfico scatter plot...


Publicidade vs. Vendas
$160,00 $140,00 $120,00 $100,00 $80,00 $60,00 $40,00 $20,00 $0,00 $0,00

Vendas

$0,50

$1,00

$1,50

$2,00

$2,50

$3,00

Gastos em publicidade
7

Agora vamos adicionar a linha de tendncia...


Publicidade vs. Vendas
$160,00 $140,00 $120,00 $100,00 $80,00 $60,00 $40,00 $20,00 $0,00 $0,00 $0,50 $1,00 $1,50 y = 48,597x + 13,824

Vendas

$2,00

$2,50

$3,00

Gastos em publicidade

Reta estimada

Com isso, temos a Equao de Regresso Estimada...


Para estimarmos quais sero as vendas para um investimento de $2,0 milhes em publicidade, basta usarmos a equao determinada:

= 13,82 + 48,6 x y = 13,82 + 48,6(2) = US $111,02 y


Concluso: As vendas estimadas sero de $111,02 milhes
9

Regresso Linear Simples


A regresso linear simples ocorre quando desejamos explicar uma varivel y usando uma varivel explicativa x. O Modelo de Regresso Linear Simples:

y = 0 + 1 x +
A Equao de Regresso Estimada
Valores estimados

= b 0 + b1 x y
No causa e efeito entre as variveis
10

Anlise ANOVA no Excel...


ANalysis Of VAriance
Coeficiente de Correlao (1<r<1) Relao Linear

RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo 0,964136108 R-Quadrado 0,929558435 R-quadrado ajustado 0,923688304 Erro padro 9,106122272 Observaes 14 ANOVA gl Regresso Resduo Total

Coeficiente de Determinao (0<r2<1) Relaes lineares e no-lineares

SQ MQ F F de significao 1 13130,94245 13130,94245 158,3539653 2,8433E-08 12 995,057554 82,92146283 13 14126 95% inferiores 95% superiores 1,667701969 25,97978005 40,18286093 57,01138367
Valor p
11

Interseo Varivel X 1

Coeficientes Erro padro Stat t valor-P 13,82374101 5,579203078 2,477726803 0,029078957 48,5971223 3,861856052 12,5838772 2,8433E-08
Teste t

Coeficiente de Correlao
Como exemplo, podemos citar a correlao fortemente positiva da relao entre idade e estatura de uma criana; quanto maior a idade maior a estatura. Um exemplo de forte correlao negativa a relao entre a temperatura e o consumo de cobertores; quando maior a temperatura, menor o consumo de cobertores. Um exemplo da inexistncia de correlao a relao entre o nmero do calado de um adulto e o seu nvel intelectual. Ou ainda, a paixo pelo Timo em funo do nmero de vitrias ou derrotas!
12

Resumo
R-Mltiplo=0,96 o coeficiente de correlao amostral (lembre-se que o coeficiente de correlao situa-se entre 1 e 1) R-quadrado=0,93 o coeficiente de Determinao da regresso. Explica que 93% das variaes nas vendas (y) so explicadas pelos gastos em publicidade, ficando 7% sem explicao.

O valor 0,0000000284 o valor p do teste de hiptese de 1 ser zero. Como o p-value menor que 5% rejeitamos a hiptese nula, isto , 1 diferente de zero. (p , a hiptese nula no rejeitada; p < , a hiptese nula rejeitada). A equao estimada y = 13,82 + 48,6x
13

Exerccio
O ndice Dow Jones Industrial Average (DJIA) e o Standard & Poors (S&P500) so ambos medidas da movimentao no mercado de aes. O DJIA baseado na movimentao dos preos dos papis das 30 maiores companhias, o S&P500 um ndice composto de 500 aes. A tabela a seguir mostra os ndices para o DJIA e S&P500 para as ltimas 10 semanas de 1997.
14

Data out/24 out/31 nov/07 nov/14 nov/21 nov/28 dez/05 dez/12 dez/19 dez/26

Dow Jones 7715 7442 7581 7572 7881 7823 8149 7838 7756 7679

S&P500 942 915 928 928 963 955 984 953 947 936

1) Qual a relao entre o DJIA e o S&P500 ? 2) Quo confiveis so os valores estimados?


15

Anlise da Regresso

Dow Jones versus S&P500


990 980 valores S&P500 970 960 950 940 930 920 910 7400 7500 7600 7700 7800 valores DJ 7900 8000

y = 0,1006x + 166,08 R = 0,9904


2

8100

8200

16

Anlise ANOVA no Excel


RESUMO DOS RESULTADOS Estatstica de regresso R mltiplo R-Quadrado R-quadrado ajustado Erro padro Observaes ANOVA gl Regresso Resduo Total SQ MQ F F de significao 1 3546,64276 3546,642756 828,237722 2,29915E-09 8 34,2572444 4,282155549 9 3580,9 0,995205176 0,990433342 0,98923751 2,069336983 10

Interseo Dow Jones

Coeficientes Erro padro Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% 166,0828321 27,0767411 6,133782172 0,00027891 103,6437551 228,5219092 103,6437551 228,5219092 0,100601422 0,00349564 28,77911954 2,2992E-09 0,092540463 0,10866238 0,092540463 0,10866238

17

Estudo de caso 1: Gastos e Desempenho Estudantil


Deseja-se descobrir se o progresso educacional dos estudantes est relacionado com quanto um estado em que residem gasta com educao. Em muitas comunidades, essa importante questo tem sido colocada nas pautas das discusses pelos secretrios de educao, que vem uma relao positiva entre os gastos e o progresso dos estudantes, para que haja um aumento na taxa de gastos governamentais com o ensino. Neste caso voc convidado a analisar os dados relativos a gastos e pontuaes de progresso para determinar se h alguma relao entre os gastos e o progresso dos estudantes nas escolas pblicas. O Levantamento Nacional de Progresso Educacional (National Assessment Educational Progress-NAEP) freqentemente usado para medir a qualidade da educao nos EUA. O arquivo EC-Reg Linear.xls (planilha EC1-naep) exibe o gasto total corrente por aluno/ano e a pontuao mdia do teste NAEP para 35 estados participantes do programa. A pontuao mdia a soma das pontuaes em matemtica, cincias e leitura no teste NAEP de 1996. A pontuao mxima de 1300 pontos.
18

Relatrio Gerencial:
a) b) Desenvolva um resumo numrico e grfico dos dados (mdia, desvio padro e diagrama de disperso). Verifique utilizando regresso linear - se h alguma relao entre a quantia gasta por aluno e a pontuao mdia do teste NAEP. Discuta suas concluses (teste o gasto como varivel independente). Voc acredita que a regresso estimada poderia ser usada para estimar as pontuaes mdias para estados que no participaram do programa NAEP? Explique. Suponha que voc use na regresso somente estados que gastam no mnimo US$4000 por aluno e no mais que US$6000 por aluno. Para estes estados, a relao entre as duas variveis parece ser de alguma forma diferente do conjunto completo de dados? Explique. Baseado nas suas anlises, voc acha que o nvel de progresso educacional dos estudantes est relacionado com o montante que o estado gasta com educao?
19

c)

d)

e)

Relatrio Gerencial:
Desenvolva um resumo numrico e grfico dos dados (mdia, desvio padro e diagrama de disperso).
Gasto por aluno (US$) Mdia 5068,828571 Erro padro 183,5153486 Mediana 4985 Modo #N/D Desvio padro 1085,691444 Varincia da amostra 1178725,911 Curtose 1,125309956 Assimetria 0,881640123 Intervalo 4882 Mnimo 3280 Mximo 8162 Soma 177409 Contagem 35 Pontuao Mdia Mdia Erro padro Mediana Modo Desvio padro Varincia da amostra Curtose Assimetria Intervalo Mnimo Mximo Soma Contagem 631,1714 4,661028 628 580 27,57502 760,3815 -0,75544 -0,28605 95 580 675 22091 35

Gastos por Aluno versus Pontuao Mdia


680 pontuao mdia 660 640 620 600 580 560 0 1.000 2.000 3.000 4.000 5.000 6.000 7.000 8.000 9.000
20

gastos com alunos

Relatrio Gerencial:
Verifique utilizando regresso linear - se h alguma relao entre a quantia gasta por aluno e a pontuao mdia do teste NAEP. Discuta suas concluses (teste o gasto como varivel independente).

Gastos por Aluno versus Pontuao Mdia


680 pontuao mdia 660 640 620 600 580 560 0 1.000 2.000 3.000 4.000 5.000 6.000 7.000 8.000 9.000 gastos com alunos y = 0,0087x + 587,32 R = 0,116
2

O que voc acha


21

Relatrio Gerencial:
Voc acredita que a regresso estimada poderia ser usada para estimar as pontuaes mdias para estados que no participaram do programa NAEP? Explique.

22

Relatrio Gerencial:
Suponha que voc use na regresso somente estados que gastam no mnimo US$4000 por aluno e no mais que US$6000 por aluno. Para estes estados, a relao entre as duas variveis parece ser de alguma forma diferente do conjunto completo de dados? Explique.
Gasto por Aluno versus Pontuao Mdia
680

P ontuao M dia

660 640 620 600 580 560 0 1.000 2.000 3.000 4.000 5.000 6.000

Gasto por Aluno

O que voc acha


23

Anlise ANOVA no Excel

RESUMO DOS RESULTADOS DE US$ 4000,00 US$ 6000,00 Estatstica de regresso R mltiplo 0,394666329 R-Quadrado 0,155761512 R-quadrado ajustado 0,117387035 Erro padro 27,102816 Observaes 24 ANOVA gl Regresso Resduo Total SQ MQ F F de significao 1 2981,58 2981,58 4,058987 0,056320226 22 16160,38 734,5626 23 19141,96

Interseo Gasto por aluno (US$)

Coeficientes Erro padro Stat t valor-P 95% inferiores 95% superiores Inferior 95,0% Superior 95,0% 524,2888252 53,35746 9,82597 1,66E-09 413,6322178 634,9454326 413,6322178 634,9454326 0,022119752 0,010979 2,014693 0,05632 -0,000649753 0,044889257 -0,000649753 0,044889257

24

Relatrio Gerencial:
Baseado nas suas anlises, voc acha que o nvel de progresso educacional dos estudantes est relacionado com o montante que o estado gasta com educao?

25

Exerccio Proposto
A Value Line (February 24, 1995) reportou que o mercado beta para a Woolworth Corporation 1,25. Mercados beta para aes so determinados por regresso linear simples. Para cada ao, a varivel dependente a sua porcentagem do retorno trimestral (valorizao do capital mais dividendos) menos a porcentagem de retorno que poderia ser obtida de um investimento livre de riscos (risk-free). A varivel independente a porcentagem de retorno trimestral (valorizao do capital mais dividendos) para o mercado de aes (S&P500) menos a porcentagem de retorno de um investimento livre de riscos. Uma equao de regresso estimada desenvolvida com dados trimestrais; o mercado beta para a ao a inclinao da equao de regresso estimada (b1). O valor do mercado beta freqentemente interpretado como uma medida do risco associado ao. Mercados beta maiores que 1 indicam que ao mais voltil do que a mdia do mercado; mercados beta menores que 1 indicam que a ao menos voltil do que a mdia do mercado.
26

As diferenas entre a porcentagem de retorno e a porcentagem livre de riscos para 10 trimestres da S&P500 e da IBM so mostradas: a) Desenvolva a equao de regresso linear para determinar o mercado beta para a IBM. Qual o mercado beta da IBM? b) Faa o teste t de significncia da regresso com 0,05 de nvel de significncia c) A equao de regresso estimada forneceu um bom ajuste? Explique. d) Use os mercados beta da Woolworth e da IBM para comparar o risco associado s duas aes.

S&P 500 1,2 -2,5 -3,0 2,0 5,0 1,2 3,0 -1,0 0,5 2,5

IBM -0,7 -2,0 -5,5 4,7 1,8 4,1 2,6 2,0 -1,3 5,5

(a) Mercado beta=0,95; (b)relao significante; (c)r2=0,470, no um ajuste muito bom; (d) Woolworth tem um risco maior
27

Analisando a no-linearidade
Anos 1 2 3 4 5 6 7 8 Gastos com Volume de vendas propaganda (R$ mil) (mil un.) 7 7 6 5 4,5 3 3 1,5 2 1 1 0,5 8 7 8 9

28

Desenhando o grfico scatter plot...


Volume de vendas 10 8 6 4 2 0 0 2 4 6 8 10 Gastos com propaganda

Como os dados esto relacionados


29

Tipos de regresso
Funo linear 13 Volume de vendas 8 3 -2 0 2 4 6 8 10 y = 1,1418x - 1,3878 R2 = 0,9456 Volume de vendas 13 8 3 -2 0 2 4 6 8 10 y = 3,8457Ln(x) - 1,1303 R2 = 0,8085 Funo logartm ica

Gastos com propaganda

Gastos com propaganda

Funo potncia 13 Volume de vendas 8 3 -2 0 2 4 6 8 10 y = 0,4133x 1,3919 R2 = 0,9786 Volume de vendas 13 8 3 -2 0

Funo polinom ial (2o grau)

y = 0,0953x 2 + 0,2491x + 0,0757 R2 = 0,967

10

Gastos com propaganda Funo exponencial 13 Volume de vendas 8 3 -2 0 2 4 6 8 y = 0,4424e0,3806x R2 = 0,9708

Gastos com propaganda

10
30

Gastos com propaganda

Principais transformaes lineares


Tipo de funo Linear Exponencial Potncia Logartimica Equao original y=a+b.x y=a.eb.x y=ax b y=a+b.lnx Equao linearizada y=a+b.x ln y=ln a + b.x ln y=ln a + b.ln x y=a+b.ln x x x x ln x ln x y y ln y ln y y

Anos 1 2 3 4 5 6 7 8

Gastos com propaganda (R$ mil) 7 6 4,5 3 2 1 8 8

Volume de vendas (mil un.) 7 5 3 1,5 1 0,5 7 9

ln x 1,946 1,792 1,504 1,099 0,693 0,000 2,079 2,079

ln y 1,946 1,609 1,099 0,405 0,000 -0,693 1,946 2,197


31

Estatstica de regresso R mltiplo 0,989257161 R-Quadrado 0,978629731 R-quadrado ajustado 0,975068019 Erro padro 0,166589309 Observaes 8 ANOVA gl Regresso Resduo Total 1 6 7 Coeficientes -0,883601976 1,391859059 SQ MQ F F de significao 7,625247085 7,6252471 274,7639 3,07462E-06 0,166511988 0,027752 7,791759073 Erro padro Stat t valor-P 95% inferiores 95% superiores 0,131413674 -6,7238207 0,000526 -1,205159887 -0,562044065 0,083968313 16,576004 3,07E-06 1,186395849 1,59732227

Interseo ln x

32

Exerccio de hoje
Escolha um dos casos abaixo, faa todas as anlises estatsticas e de regresso. O que podemos concluir?
Estudo de caso 2: U.S. Department of Transportation Estudo de caso 3: Mudanas leste-oeste Estudo de caso 4: Springville Herald

Entregar exerccio, na prxima aula, em duplas


33

Você também pode gostar