Você está na página 1de 15

3º Grupo

Acácio Domingos Fungulane Bonde


Adolfo Salvador Varrela de Barros
Eugénio Francisco Celso Negrinha
Jamal Freiria Jamal
Valige Pedro Valige Faria
Victor José Da Silva Saiba

Exercícios de Econometria – 1

Licenciatura em Ensino de Matemática com habilitações em Estatística

Universidade Pedagógica
Quelimane
2019
2

3º Grupo
Acácio Domingos Fungulane Bonde
Adolfo Salvador Varrela de Barros
Eugénio Francisco Celso Negrinha
Jamal Freiria Jamal
Valige Pedro Valige Faria
Victor José Da Silva Saiba

Exercícios de Econometria – 1

Licenciatura em Ensino de Matemática com habilitações em Estatística

Trabalho de carácter
avaliativo a ser apresentado
no departamento de FCNM,
na cadeira de Econometria
Básica, do 4º ano, lesionada
pelo docente:
Dr. Henriques Laquene Jr.

Universidade Pedagógica
Quelimane
2019
Introdução
3

O presente trabalho de exercício de aplicação, visa trazer mais habilidades e pratica na cadeira de
econometria básica, assim nos ajuda a saber a sua verdadeira aplicação na vida real.

1. a) A partir do gráfico de dispersão, existe relação entre o custo vs horas de uso ?


4

Existe uma relação positiva, aparentemente parece ser forte, as nuvens de pontos estão quase
alinhados, pois se observa que quando as horas de uso aumentam os custos de manutenção
mensal aumentam, isto é os custos de manutenção mensal variam directamente com as horas de
uso.

b) Estimação do coeficiente de Pearson

Ord. Custo (Y) Horas de uso (X) X^2 Y^2 XY Ŷ (Y-Ŷ)^2 (Y-Ȳ)^2
1 1070 280 78400 1144900 299600 1060.47 90.8209 10455.06
2 910 267 71289 828100 242970 976.23 4386.413 68775.06
3 865 240 57600 748225 207600 801.27 4061.513 94402.56
4 1115 325 105625 1243225 362375 1352.07 56202.18 3277.563
5 1250 285 81225 1562500 356250 1092.87 24689.84 6045.063
6 1450 352 123904 2102500 510400 1527.03 5933.621 77145.06
7 918 265 70225 842724 243270 963.27 2049.373 64643.06
8 1800 364 132496 3240000 655200 1604.79 38106.94 394070.1
Total 9378 2378 720764 1171217 2877665 9378 135520.7 718813.5
4
Media 1172.25 297.25      

∑ ( X i)∑ (Y i ) 9378 ∙ 2378


∑ X i Y i− n
2877665−
8 90054,5 90
r xy = = = =
2 2 √13903,5 ∙718813,5 99
)√
2 2

√( 2
∑X −
i
( ∑ Xi)
n )( ∑Y 2
i −
(∑ Y i )
n
( 720764−
2378
8 )( 11712174−
9378
8 )

Como o coeficiente de correlação linear de Pearson esta no intervalo de 0,5 a 1, notamos que ela
é forte positiva, logo a conclusão na diverge de a).
5

c) Matriz das correlações de Pearson

Custo Horas de uso


Custo 1 0,90
Horas de uso 0,90 1

d) Teste de significância da correlação

H 0 : ρ xy =0 ( não há correlaҫão linear significativa entre o custo e as horas de uso )


Hipóteses: { H 1 : ρ xy ≠ 0 ( há correlaҫão linear significativa entre o custo e as horas de uso )

r ∙ √ n−2
O nível de significância é de 5%, e como o n≤ 30 usamos o t (cal )=
√ 1−r 2
RNH0: {t ∈ R :t cal< t ( 0,25; 6)=−2,4469 ˅ t cal >t (0,25 ;6 )=2,4469 }

RAH0: {t ∈ R :t ( 0,25 ;6)=−2,4469<t cal< t ( 0,25;6 )=2,4469 }

RD: RH0 se t cal ∈ RC.

r ∙ √ n−2 0,90 √ 8−2 2,20


t (cal )= = = =5
√ 1−r 2 √ 1−( 0,90 )2 0,44
Conclusão:

RH0 pois t (cal )>t (0,25 ;6 )=2,4469 , há evidências estatísticas suficientes para afirmar ao nível de
significância de 5% que há correlação linear significativa entre o custo e as horas de uso, e essa
relação é directa forte, isto mostra que o custo varia directamente com as horas de uso.

e) Estimação do MRLS pelo método de OLS

∑ ( Xi ) ∑ (Y i )
∑ X i Y i− n 90054,5
^β 1= = =6,48
2 13903,5
( ∑ X i)
(∑ 2
X−
i
n )
^β 0=Ý − ^β 1 X́ =1172,25−6,48∙ 297,25=−753,93
6

Y = ^β0 + β^ 1 X i +ε i
Y =−753,93+ 6,48 X i +ε i ou Custos=−753,93+6,48 (horas de uso)i+ ε i

f) Interpretação dos parâmetros

Y =−753,93+ 6,48 X i +ε i ou Custos=−753,93+6,48 (horas de uso)i+ ε i

^β 0=−753,93, significa que se as horas de uso forem constantes ou nulas, espera-se em media

que o custo seja de −753,93.

^β 1=6,48, significa que a um aumento a mais das horas de uso, os custos em média aumentem

em 6,48 unidades.

g) Inferência sobre os parâmetros

Hipóteses:

Para ^β 0

H 0 : β 0=0 ( o parâmetro não é significativo )


{ H 1 : β 0 ≠ 0 ( o parâmetro é significativo )

Nível de significância de 5%

IC β0
95 %

[
: ^β 0 ± t
( α2 ; n−2 )

√ ∑ ( Y −Y^ )
n−2


1
n
+
2
∑X −
i
X́ 2
(∑ X i )
n
2

]
[ ]
2
135520.7 1 ( 297.25 )
¿ −753,93 ± 2,4469∙
6
∙ +
8 13903,5 √
=[ −753,93 ± 936,14 ]

IC β95 % : [−1690,07 ; 182,21 ]
0

Conclusão

Como β 0=0 , pertence ao IC, então significa que ^β 0 não é significativo no MRLS.
7

Para: β 1

Hipóteses:

H 0 : β 1=0 ( o parâmetro não é significativo )


{ H 1 : β 1 ≠ 0 ( o parâmetro é significativo )

IC β1
95 %

[
: ^β1 ± t α
( ;n−2)
2

√ ∑ ( Y −Y^ )
n−2


1

∑ X 2i −
2
(∑ X i )
n
] =[ 6,48± 2,4469 ∙1,27 ] =[ 6,48 ±3,11 ]

IC β95 % : [ 3,37 ; 9,59 ]


1

Conclusão

Como β 1=0, não pertence ao IC, então significa que ^β 1 é significativo no MRLS.

h) O valor esperado do custo de manutenção mensal do transformador, se o número de


horas de uso no 10º mês for de 400.
Como o β 0 não é significativo, então podemos ter o valor esperado a partir do β 1 Porque este é
significativo.
Custos=6,48^
^ ( horas de uso )10
Horas de uso for de 400, teremos: c^
usto=6,48 ×400=2592.

Logo o valor esperado de manutenção mensal do transformador, se o número de horas de uso no


10o mês for de 400, será de 2592.
i) Construção do IC para esta previsão pontual e em média h) a 90% de confiança.
8

[ √ ]
2

[ ]
2
( X i − X́ ) 1 ( 400−297.25 )
IC Y^10
90 % = Y^ ± t
( α2 ; n−2)
Sβ i
1
1+ +
n
∑ Xi −2 (∑ X i )
2
= 2592± 1,9432∙
√ 135520.7
6 √
∙ 1+ +
8 13903,5
=[ 2592 ±1

n
Y^10
IC 90 %=[ 2191,11 ; 2992,89 ] Previsão pontual.

[ ]
2
( X i− X́ )

√ √
1 135520.7 1 ( 400−297.25 )
IC
Y 10
90 % =Y^ ± t
( α2 ;n −2)
Sβ i
n
+
2
∑ Xi −
( ∑ i)X
2
= 2592 ± 1,9432
√ 6
∙ +
8 13903,5
= [ 2592 ±1,9432 ∙2

IC Y90 %=[ 2546,22 ; 2637,78 ] Previsão em média.


10

Na previsão pontual para as horas de uso de 400 a amplitude é de 801,78 é de esperar que o custo
médio esperado fosse maior que amplitude, pois os valores das horas rondam entre 2100 a 3000
isto mostra que houve aumento, mas se tivéssemos abaixo desse valor a amplitude seria menor
que o valor médio esperado do custo.

j) Interpretação da tabela de ANOVA no MRLS

Hipótese:

H 0 : β 1=…=β i=0 (o modelo não é significativo)


{ H 1 :∃ βi ≠ 0 ( i=1 ,… , 8 ) o modelo é significativo

Nível de significância α =5 %; estatístico F ( p ;n− p−1)=F (1 ;6 )=5,99

SQT =SQR+ SQE SQR 583292,8


QMR= = =583292,8
p 1

SQT =∑ (Y −Ý )2=¿ 718813.5 ¿ SQE 135520.7


QME= = =22586,78
n− p−1 6
9

SQE=∑ (Y −Y^ )2=¿ 135520.7 ¿ QMR 583292,8


F= = =25,82
QME 22586,78
SQR=SQT −SQE=718813.5−135520.7=583292,8

Tabela de ANOVA

Fonte de variação SQ g.l QM F


Regressão 583292,8 1 583292,8
Erros 135520.7 6 22586,78
25,82
Total 718813.5 7

RD : R H O se QMR>QME

Conclusão:

Como QMR>QME e R H O, concluímos assim que existe um efeito significativo sobre o custo,
ou por outra o modelo é significativo.

k) Estimação e interpretação da variabilidade explicada das horas de uso sobre os


custos de manutenção mensal.

SQR 583292,8
R 2= = =0,81
SQT 718813.5

SQE 135520.7
R2a =1− =1− =0,81
SQT 718813.5

A partir do R2 e R2a , podemos concluir que, a variabilidade explicada pelas horas de trabalho
sobre os custos de manutenção mensal é de 81%, concluindo desta que os 19% é explicado pelo
erro.

1. a) Gráfico de dispersão e sua interpretação


10

Gráfico de dispersão
45
40
35
30
25
Consumo

20
15
10
5
0
5 10 15 20 25 30 35 40 45 50 55
Rendimento

Observando para o gráfico de dispersão, notamos que existe uma relação forte positiva mas
não perfeita, porque as nuvens de pontos tendem a estar alinhadas.

b) Gráfico de dispersão junto a recta de regressão e sua interpretação

Gráfico de dispersão
45
40
35
30
Consumo

25
20
15
10
5
0
5 10 15 20 25 30 35 40 45 50 55
Rendimento

Como havíamos referido na alínea a), notamos agora pela presença da recta que existe uma
relação forte positiva, visto que nem todos os pontos estão alinhados a recta.

c) Estatística de regressão e sua interpretação

Estatística de regressão
R múltiplo 0.970131777
Quadrado de R 0.941155664
Quadrado de R ajustado 0.937886534
Erro-padrão 2.372747741
11

Observações 20

A partir da tabela de estatística de regressão, observa-se que o valor de R múltiplo = coeficiente


de Pearson; logo:

∑ ( Xi )∑ (Y i )
∑ X i Y i− n
r xy = =0.970131777 ; desta podemos ainda concluir que
2 2

√(∑ X 2i −
( ∑ Xi)
n )(∑ Y 2i −
(∑ Y i )
n )
existe uma relação forte positiva entre o consumo e o rendimento das famílias.

Ainda podemos observar os valores de R Quadrado e R Quadrado ajustado comparativamente ao


valor de Erropadrao, notamos que modelo explica mais em relação ao erro padrao a
aproximadamente 94%.

d) Tabela de ANOVA e sua interpretação

Hipótese:

H 0 : β 1=…=β i=0 (o modelo não é significativo)


{ H 1 :∃ β i ≠ 0 ( i=1 ,… ,20 ) o modelo é significativo

Nível de significância α =5 %; estatístico F ( p ;n− p−1)=F (1 ;18 )=4,41

  gl SQ MQ F F de significância
Regressã 1 1620.81123 1620.811227
o 287.8918025 1.61227E-12
Residual 18 101.338773 5.629931844
   
Total 19 1722.15  
12

RD : R H O se QMR>QME

Conclusão:

Como QMR>QME e R H O, concluímos assim que existe um efeito significativo sobre o


Consumo, ou por outra o modelo é significativo, ainda observando o p – valor, que é menor que
5% de significância, também concluímos que existe um efeito significativo no modelo.

e) Tabela dos coeficientes de regressão e a sua interpretação

  Coeficientes Erro-padrão Stat t valor P 95% inferior 95% superior


Interceptar 1.342267554 1.06190977 1.264012806 0.222349874 -0.888722096 3.573257205
Variável X 1 0.714312698 0.04209919 16.96737465 1.61227E-12 0.625865585 0.80275981

^
β 0=1,342267554 : Estima-se que uma família cujo rendimento anual fosse constrante ou nulo
teria um consumo médio anual de 1342,27 u.m.

^
β 1=0,714312698 : Se o rendimento de uma família variar de 1000 u.m, estima-se que o seu
consumo varie, no mesmo sentido em 714,312698 u.m.

IC sobre os parâmetros

Hipóteses:

Para ^β 0

H 0 : β 0=0 ( o parâmetro não é significativo )


{ H 1 : β 0 ≠ 0 ( o parâmetro é significativo )

Nível de significância de 5%

IC β0
95 %

[
: ^β 0 ± t
( α2 ; n−2 )

√ ∑ ( Y −Y^ )
n−2


1
n
+
X́ 2

∑ X 2i −
2
(∑ X i )
n
] =[ −0.888722096 ; 3.573257205 ]
13

Como β 0=0 , pertence ao IC, então significa que ^β 0 não é significativo no MRLS.

Para: β 1

Hipóteses:

H 0 : β 1=0 ( o parâmetro não é significativo )


{ H 1 : β 1 ≠ 0 ( o parâmetro é significativo )

IC β1
95 %

[
: ^β1 ± t α
( ;n−2)
2

√ ∑ ( Y −Y^ )
n−2


1

∑ X 2i −
(∑ X i )
n
2

] =[ 0.625865585; 0.80275981 ]

Como β 1=0, não pertence ao IC, então significa que ^β 1 é significativo no MRLS.

f) Modelo de RLS tendo em conta o método OLS e a sua interpretação

Y =1.342267554 +0.714312698 X i +ε i

Como o ^β 0 não é significativo, temos:


Y =0.714312698 X i+ ε i ou Consumo=0.714312698(Rendimento)+ ε i

g) Diagnóstico de modelo (os gráficos de: normalidade, independência, homocedasticidade


e valores atípicos (diagrama de caixa ou descritivos)

Gráfico de Normalidade

Desenho de probabilidade normal


50
40
Consumo

30
20
10
0
0 20 40 60 80 100 120
Rendimento
14

A partir do gráfico da distribuição normal, notamos que os pontos apresentam um


comportamento exponencial e, com isso ela não se distribui normalmente.

Gráfico da Homocedasticidade

Variável X 1 Desenho de residuais


6
4
2
Consumo

0
-2 5 10 15 20 25 30 35 40 45 50 55
-4
-6
-8
Rendimento

Logo a partir do gráfico dos resíduos, notamos que não são homogéneos, e há existência de
valores atípicos.
Gráfico de valores atípicos (Outlaers)

45

40

35

30

25 CONSUMO (Y)
Media
20
LI
15 LS

10

0
1 2 3 4 5 6 7 8 9 10 1112131415 1617 18 19 20
-5

Olhando para o gráfico, notamos que existem valores do consumo que andam em torno da
média, mas há um dado que esta fora dos limites, logo, nota que este é um atípico.

Descritivos
15

Média de Y 16.95
9.52047
Desvio padrão de Y 7
Mínimo 7.5
Quartil 1 9.825
Mediana 14
Quartil 3 22.025
Intervalo IQ 12.2
Limite inferior -1.35
Limite Superior 35.25

Aqui notamos que dado 38,6 é um atípico severo, porque esta acima do limite superior e esta a
três desvios acima do quartil 3.

Conclusão
Contudo, o grupo chegou as conclusões que o pacote Excel pode nos ajudar bastante na
interpretação dos dados em particular (MRLS), nos facilita bastante com os gráficos de
normalidade entre outros gráficos, porem é muito trabalhoso.

Você também pode gostar