Você está na página 1de 11

Em 2012, Angeliki Xifara del Architectural Science group, Welsh School of

Architecture, Cardiff University, UK e Athanasios Tsanas del Oxford Centre for


Industrial and Applied Mathematics (OCIAM), Mathematical Institute, University of
Oxford, Oxford, UK apresentaram um estudo sobre o efeito da estimativa da
eficiência energética em edifícios sobre a base de análise estatística e ferramentas
de aprendizagem máquina (Tsanas & Xifara, 2012). Foram analisadas 12 tipologias
diferentes de edifícios, as quais diferiam em relação à área envidraçada, a
distribuição da área envidraçada e a orientação entre outros parâmetros. Ao todo
foram analisadas 768 amostras, das quais foram avaliadas 8 variáveis (X1, X2, X3,
X4, X5, X6, X7, X8) com o objetivo de predizer as cargas térmicas necessárias para
esquentar e esfriar o recinto (Y1, Y2). Ver arquivo ENB2012_data.xlsx

Desenvolvimento do caso pratico

1. Realize uma análise estatística descritiva completa das variáveis


independentes.

Descrição X1 X2 X3 X4 X5 X6 X7 X8

Média 0.76 671.71 318.5 176.6 5.25 3.5 0.23 2.81


Mediana 0.75 673.75 318.5 183.75 5.25 3.5 0.25 3
Moda 0.98 514.5 294 220.5 7 2 0.1 1

Variação 0.01117 7,749,06 1,900,79 2,037,30 30,625 1.25 0.01772 2,402,34


4 1 2 7 5 4

Desvio 0.10577 8,808,61 4,362,64 4,516,59 175,11 1,118,76 0.13322 155,096


Padrão 7 2 8 5 4 3 1
Coeficient 14% 13 14 26 33 32 57 55
e de
variação
Máximo 0.98 808.5 416.5 220.5 7 5 0.4 5
Mínimo 0.62 514.5 245 110.25 3.5 2 0 0
Amplitud 0.36 294 171.5 110.25 3.5 3 0.4 5
e
2

Matriz de covariâncias
X1 X2 X3 X4 X5 X6 X7 X8
X1 0.0112 -9.23 -0.9392 -4.1454 0.1531 0.000 0.0000 0.0000
0
X2 -9.2300 7749.0608 7749.0908 3499.3741 -132.197 0.000 0.0000 0.0000
0
X3 -0.9392 750.3125 1900.7917 -575.2396 21.4375 0.000 0.0000 0.0000
0
X4 -4.1454 3499.3741 -575.2396 2037.3069 -76.8177 0.000 0.0000 0.0000
0
X5 0.1531 -132.1979 21.4375 -76.8177 -3.0625 0.000 0.0000 0.0000
0
X6 0.0000 0.0000 0.0000 0.0000 0.0000 1.250 0.0000 0.0000
0
X7 0.0000 0.0000 0.0000 0.0000 0.0000 0.000 0.0177 0.04439
0
X8 0.0000 0.0000 0.0000 0.0000 0.0000 0.000 0.0439 2.4023
0

Matriz de correlação
X1 X2 X3 X4 X5 X6 X7 X8
X1 1.0000 - 0.9919 -0.2038 -0.8688 0.8277 0.000 0.0000 0.0000
0
X2 -0.9919 1.0000 0.1955 0.8581 -0.8581 0.000 0.0000 0.0000
0
X3 -0.2038 0.1955 1.0000 -0.2923 0.2810 0.000 0.0000 0.0000
0
X4 -0.8688 0.8807 -0.2923 1.0000 -0.9725 0.000 0.0000 0.0000
0
X5 0.8277 -0.8581 0.2810 -76.8177 1.0000 0.000 0.0000 0.0000
0
X6 0.0000 0.0000 0.0000 0.0000 0.0000 1.000 0.0000 0.0000
0
X7 0.0000 0.0000 0.0000 0.0000 0.0000 0.000 1.0000 0.2130
0
X8 0.0000 0.0000 0.0000 0.0000 0.0000 0.000 0.2130 1.0000
0
3
2. Desenvolva um modelo de Regressão Linear Simples que permita predizer a carga térmica de aquecimento (Y1) em
função da análise individual de cada uma das 8 variáveis analisadas. Qual variável descreve melhor a carga térmica de
aquecimento? Que porcentagem da variabilidade é capaz de explicar o modelo?

Regressão Linear Y1 = a + bxi

Descrição X1 X2 X3 X4 X5 X6 X7 X8 Y1 Y2
Media 0.76416667 671.708333 318.5 176.604166 5.25 3.5 0.234375 2.8125 22.31 24.59
3 7
Mediana 0.75 673.75 318.5 183.75 5.25 3.5 0.25 3 18.95 22.08
Moda 0.98 514.5 294 220.5 7 2 0.1 1 15.16 21.33
variância 0.11174306 7749.06074 1900.79166 2037.30685 3.0625 1.25 0.01772246 2.40234375 101.679648 90.3851403
6 7 8 1 2
Desvio 0.10577476 88.0861160 436264814 45.1659502 1.75114043 1.118762 0.13322056 1.55095966 10.0836326 9.50710998
padrão 6 4 2 7 3 5 9 7
Coeficient 0.13842199 0.13113447 0.13697482 0.25574679 0.33355059 0.31964645 0.56840773 0.55145232 0.45203498 0.38666026
e de 7 4 8 3 5 5 4 6
variação
Máximo 0.98 808.5 416.5 220.5 7 5 0.4 5 43.1 48.03
Mínimo 0.62 514.5 245 110.25 3.5 2 0 0 6.01 10.13
Amplitud 0.36 294 171.5 110.25 3.5 3 0.4 5 37.09 37.13
e
2

Matriz de Covariância

X1 X2 X3 X4 X5 X6 X7 X8
Y1 0.663296191 -584.1798662 200.325398 -392.2526323 15.6952076 -0.02916276 0.3622550 1.36549235
4 8
Y2 0.637500087 -563.2321376 177.036425 -3701342817 14.9035742 0.15188802 0.2626427 0.74451497
8 2 1 4 4

Equações da regressão linear de Y1 com variáveis


independentes

Y1=a+bX1 Y1+a+bX2 Y1=a+bX3 Y1=a+bX4 Y1=a+bX5 Y1=a+bX6 Y1=a+bX7 Y1=a+bX8


a) -2305301406 72.94539474 -11.25968133 56.3096574 -4.598875 22.38885104 17.51710464 20.7085012
3
b) 59.35905261 -0.075387184 0.105390508 -0.19253488 5.12496577 -0.023330208 20.4379683 0.568400068
4
a+bXi Y1=- Y1=72.94- Y1=- Y1=56.31- Y1=- Y1=22.39- Y1=17.51+20. Y1=20.71+0.57
23.05+59.36X 0.075X2 11.26+0.1X3 0.19X4 4.6+5.12X5 0.02X6 43X7 X8
1
Coeficiente 0.3408 0.0000 0.0000 0.0000 0.0000 0.0000 0.0404 0.0000
de
determinaçã
o
R² 0.5838- 0.007 0.0010 0.0019 0.0504 0.0002 0.201 0.0056
3

3. Desenvolva um modelo de Regressão Linear que permita predizer a carga térmica de esfriamento (Y2) em função da
análise individual de cada uma das 8 variáveis analisadas. Qual variável descreve melhor a carga térmica de esfriamento?
Que porcentagem da variabilidade é capaz de explicar o modelo?

Regressão Linear Y2 = a + bxi

Descrição X1 X2 X3 X4 X5 X6 X7 X8 Y1 Y2

Media 0.76416667 671.70833330 318.5 176.6041667 5.25 3.5 0.234375 28 22.31 24.95
0
Mediana 0.75 673.75 318.5 183.75 5.25 3.5 0.25 3 18.95 22.08

Moda 0.98 514.5 294 220.5 7 2 0.1 1 15.16 21.08

Variância 0.01117430 7,749.0607640 1,900.79167 2,037,306,85 3.0625 1.25 0.01772460 2.40234375 101.679648 90.3851403
6 8 9 2
Desvio 0.10577747 88.086116056 43.6264814 45.16595022 1.75114043 1.11876258 0.13322056 1.55095966 10.0836326 9.50710998
Padrão 6 4 7 7 3 4 9 7

Coeficient 0.13842199 0.13697482 0.255746798 0.33355055 0.31964645 0.56840773 0.55145232 0.45203498 0.38666026
e de 7 4 9 3 5 5 4 6
variação

Máximo 0.98 808.5 416.5 220.5 7 5 0.4 5 43.10 48.03

Mínimo 0.62 514.5 245 110.25 3.5 2 0 0 6.01 10.90

Amplitude 0.36 294 171.5 110.25 3.5 3 0.4 5 37.09 37.13


4

Matrizes de covariâncias

X1 X2 X3 X4 X5 X6 X7 X8

Y1 0.663296191 -5.841798662 200.3253984 -392.2526323 15.69520768 -0.02916276 0.36225500 1.36549235

Y2 0.637500087 -5.632321376 177.0364258 -370.1342817 14.90357422 0.151888021 0.26264274 0.744514974

Y1=a+Bx1 Y1+a+bX2 Y1=a+bX3 Y1=a+bX4 Y1=a+bX Y1=a+bX6 Y1=a+bX7 Y1=a+bX8


5
a) -19.00835515 73.41015734 5.07677495 56.67289090 -0.9612239 24.16247396 21.11479850 23.71613313

b) 57.05053291 -0.072683923 0.093138259 -0.181678219 4.86647320 0.121510417 14.81797000 0.309911924

a+bXi Y2=- Y2=73,41- Y2=- Y2=56,67- Y2=- Y2=24,16+0,12X Y2=21,11+14,82X Y2=168,63+68,7X


19,00+57,05X1 0,07X2 5,08+0,09X3 0,18X4 0,96+4,87X5 6 7 8
Coeficiente 0.3984 0.0000 0.0000 0.0000 0.0029 0.0000 0.0269 0.0000
de
determinaçã
o
R 0.63119372 0.000804158 0.00103046 -0.002010045 0.53841519 0.001344363 0.16394255 0.003428793
5

4. Pesquise a possibilidade de desenvolver um modelo de regressão linear múltipla (tendo em conta o efeito de mais de
uma variável independente ao mesmo tempo) para a predição das cargas térmicas de aquecimento e esfriamento.

Estatísticas de Regressão
R Múltiplo 0.992861609
R-Quadrado 0.985774174
R-Quadrado ajustado 0.980083843

erro padrão 1.700097719


observação 8

ANOVA
gl SQ MQ F F Significado

Regressão 21,001.42334 500.71167 173.23672 0.00000


resíduo 514.4516611 2.89023355
Total 7 1015.875

Coeficientes Stat t Valor-P 95% para 95% para Menores a Maiores a


baixo cima 95% 95%
erro padrão

-3.53177954 1.806991246 -1.95450838 0.10804473 -8.176798421 1.11323932 -8.1767984210 1.1132393260


interseção 6
Y1 0.579434911 0.153953298 3.76370575 0.013107458 0.183685361 0.97518446 0.1836853610 0.975184461
1
Y2 0.447859255 0.162757622 2.751694513 0.0402292 0.029477469 0.86624104 0.0294774690 0.866241041
1
6

5. Calcule os intervalos de confiança a 95% para a média da carga térmica de aquecimento e a carga térmica de
esfriamento.

O intervalo de confiança da carga térmica de aquecimento é [21,63; 22.98]


Intervalo de
Segurança

n_X 768
média_y1 22.3072
DP_Y1 9.50711 Z0,975 1.96 0.343058 0.672394
Error_Y1 0.6722382
Limite inferior_Y1 21.63481
Limite superior_Y2 22.97958

O intervalo de confiança da carga térmica de resfriamento é (23,87; 25,3).


N_Y 768
Média_y1 24.587776
DP_Y1 10.08363
Error_Y2 0.713156
Limite inferior_Y1 23.8746
Limite superior_Y2 25.30092
7

6. Determine, para um nível de significação de 5%, se existirem diferenças entre a carga térmica de aquecimento (Y1) e a
carga térmica de esfriamento (Y2).

Diferença entre Y1 e Y2.

n_X 768
média_X1 22.3072
DP_X1 9.50711
N_Y 768
Média_y1 24.58776
DP-Y1 10.08363
Z0,975 1.96
Diferença média -2.28057
Erro Comum 1.731387

Inferior -0.54918
IC diferença

Superior -4.01195

O Intervalo de Confiança da diferença entre a carga térmica de aquecimento e a carga térmica de arrefecimento seria (-0,55,
-4,01).
Esse intervalo não contém o valor 0, existe uma diferença entre as duas variáveis.
8

Referências Bibliográficas

N.D. (2018). Estatística Básica: [Apostila do curso de Mestrado em Auditoria e Gestão Empresarial, Fundação Universitária Ibero
Americana]. Brasil.

Augusto m horiguti. (2014). Matemática Comercial e Financeira e Fundamentos de Estatística. (1 ed.). : Editoria Érica.

Sonia vieira. (2012). Estatística básica . (1 ed.). : Cengage Learning.

Você também pode gostar