Você está na página 1de 67

Exercício 1.

1
C D E F G 2
X Y 3
Número de
Género cartões de Y (Amostra 4
hipermercado X ordenada)
Feminino 4 0 0 5
Masculino 1 1 0 6
Masculino 0 1 0 7
Masculino 2 1 0 8
Feminino 3 0 0 9
Masculino 1 1 0 10
Feminino 2 0 1 11
Masculino 3 1 1 12
Masculino 0 1 1 13
Masculino 0 1 1 14
Feminino 1 0 1 15
Feminino 5 0 2 16
Feminino 0 0 2 17
Masculino 2 1 2 18
Feminino 1 0 2 19
Feminino 0 0 3 20
Feminino 1 0 3 21
Feminino 2 0 3 22
Masculino 3 1 4 23
Masculino 0 1 5 24

Feminino: 0
Masculino: 1

(a)

X: "Género (de um cliente do banco)." representa uma variável qualitativa.

Y: "Número de cartões de pagamento e fidelização (que um cliente do banco possui)."


representa uma variável quantitativa.

(b)

A variável estatística Y é discreta.


( Tal deve-se ao facto de o conjunto de valores admissíveis de Y ser finito. )

(c)

… a população é constituída por todos os clientes do banco.


( A população é o conjunto de indivíduos que têm caraterística comum. )

Luís Costa, Universidade de Aveiro - ISCA


(d)

Procedimento destinado a obter a coluna de frequências absolutas:


.) Selecionar o domínio de células vazias D68:D73.
..) Editar =FREQUENCIA(C5:C24;C68:C73).
…) Clicar, em sinultâneo, Ctrl+Shift+Enter.
Procedimento destinado a obter a coluna de frequências absolutas acumuladas:
.) Editar =FREQUENCIA(C$5:C$24;C68:C$73) na primeira célula, E68.
..) Estender a instrução anterior às restantes células.
Procedimento destinado a obter a coluna de frequências relativas:
.) Editar =D68/20 na primeira célula, F68.
..) Estender a instrução anterior às restantes células.
Procedimento destinado a obter a coluna de frequências relativas acumuladas:
.) Editar =E68/20 na primeira célula, G68.
..) Estender a instrução às restantes células.

C D E F G
67 yi ni Ni fi Fi
68 0 6 6 0,30 0,30
69 1 5 11 0,25 0,55
70 2 4 15 0,20 0,75
71 3 3 18 0,15 0,90
72 4 1 19 0,05 0,95
73 5 1 20 0,05 1,00
74
75 n= 20 Editar =SOMA(D68:D73)

Procedimento destinado a obter a coluna de frequências absolutas:


.) Selecionar o domínio de células vazias D94:D95.
..) Editar =FREQUENCIA(E5:E24;C94:C95).
…) Clicar, em sinultâneo, Ctrl+Shift+Enter.
Procedimento destinado a obter a coluna de frequências absolutas acumuladas:
.) Editar =FREQUENCIA(E$5:E$24;C94:C$95) na primeira célula, E94.
..) Estender a instrução anterior às restantes células.
Procedimento destinado a obter a coluna de frequências relativas:
.) Editar =D94/20 na primeira célula, F94.
..) Estender a instrução anterior às restantes células.
Procedimento destinado a obter a coluna de frequências relativas acumuladas:
.) Editar =E94/20 na primeira célula, G94.
..) Estender a instrução às restantes células.

C D E F G
93 xi ni Ni fi Fi
94 0 10 10 0,50 0,50
95 1 10 20 0,50 1,00
96 Luís Costa, Universidade de Aveiro - ISCA
97 n= 20 Editar =SOMA(D94:D95)
Assim, as respostas correspondentes a (d) são as seguintes:

15 % dos inquiridos têm 3 cartões.


(Frequência relativa da observação 3 * 100 % = 0,15*100 %)

Apenas 10 % dos inquiridos têm mais de 3 cartões.


(Dado que frequência relativa acumulada na observação 3*100 % = 0,90*100 %,
conclui-se que 90% dos inquiridos possuem um número de cartões inferior ou igual
a 3, donde se deduz que (100 - 90)% = 10% dos inquiridos possuem mais de 3
cartões.)

50 % dos inquiridos são do género feminino.


(Frequência relativa da observação 0 (que corresponde ao género feminino)*100 % )
= 0,50*100 % = 50 %)
____________________________________________________________________________________________

Exercício 1.2
X
1
2 (a)
1
3 A variável estatística em estudo, X , descreve o tempo de leitura
2 de um aluno da escola no mês de férias, expresso em minutos.
2
2 (b)
3
3 A população em estudo consiste no conjunto de todos os alunos
3 da escola.
1
3
3
2
2
1
1
2
1
1
5
2
1
1
1

____________________________________________________________________________________________

Luís Costa, Universidade de Aveiro - ISCA


Exercício 2.1

X
Y
Z

(a)

Gráfico de barras: A • B C •
(O gráfico de barras é uma representação gráfica associada à distribuição de frequências de uma
amostra de uma variável estatística discreta. Ora, as variáveis estatísticas X e Z, definidas em A e
C, respetivamente, são discretas, pelo que o gráfico de barras é uma representação gráfica adequada.)

(b)

Histograma: A B • C •
(O histograma é uma representação gráfica associada à distribuição de frequências de uma
amostra de uma variável estatística contínua. Ora, a variável estatística Y, definida em B, é contínua,
pelo que o histograma é uma representação gráfica adequada.)

(c)

Gráfico de caule e folhas: A B • C •


(O gráfico de caule e folha é uma representação gráfica que evidencia a distribuição de frequências de
uma amostra de uma variável estatística bem como a natureza das observações de tal amostra.)

____________________________________________________________________________________________

Exercício 2.2

x máximo _____
____ y máximo
Q 0.75 _____
__ Q 0.75
Q 0.25 _____ __ Q 0.25
____ y mínimo
x mínimo _____

(a)

Verdadeira Na turma T1 as notas têm uma variabilidade superior.

(b)

Verdadeira Na turma T1 a nota máxima foi um 20.

(c)

Falsa Na turma T2 as notas têm uma variabilidade mínima inferior


à nota mínima da turma T1. Luís Costa, Universidade de Aveiro - ISCA
(d)

Falsa Na turma T2 há 25% de zeros.

____________________________________________________________________________________________

Procedimento de instalação do complemento "Análise de Dados" do Excel:

File -> Options -> Add - ins -> Go -> Ativar "Analysis Toolpak" e "Analysis Toolpak - VBA" -> OK

Exercício 2.3

B C D

x i:n
xi (Amostra (Amostra
original) Ordem ordenada)

3 1 0 219
2 2 0 220
2 3 0 221
0 4 0 222
3 5 0 223
3 6 0
1 7 0
2 8 0
1 9 0
1 10 0
3 11 0
0 12 0
0 13 0
1 14 0
1 15 0
1 16 0
1 17 0
1 18 0
1 19 0
2 20 0
1 21 0
2 22 0
1 23 0
2 24 0
3 25 0 Luís Costa, Universidade de Aveiro - ISCA
2 26 0
2 27 0
3 28 0
1 29 0
1 30 0
2 31 0
1 32 0
4 33 0
2 34 0
1 35 0
3 36 0
0 37 0
1 38 0
1 39 0
2 40 0
4 41 0
0 42 0
2 43 0
5 44 0
3 45 0
1 46 0
2 47 0
2 48 0
5 49 0
1 50 0
3 51 0
2 52 0
5 53 0
4 54 0
3 55 0
2 56 0
2 57 0
0 58 0
2 59 0
1 60 0
2 61 0
3 62 0
1 63 0
3 64 0
1 65 0
1 66 0
2 67 0
6 68 0
1 69 0
2 70 0
3 71 0
4 72 0
0 73 0
1 74 0 Luís Costa, Universidade de Aveiro - ISCA
4 75 0
1 76 0
2 77 0
1 78 0
0 79 0
2 80 0
3 81 0
1 82 0
2 83 0 [ Determinação do primeiro quartil, do terceiro quartil e do
0 84 0 quantil de ordem 0,90, com recurso à função percentil. ]
1 85 0
0 86 0 Editar =PERCENTIL(B$219:B$1218;0,25)
4 87 0 Editar =PERCENTIL(B$219:B$1218;0,75)
3 88 0 Editar =PERCENTIL(B$219:B$1218;0,90)
1 89 0 Q 0.25 = 1
4 90 0 Q 0.75 = 3
1 91 0 Q 0.90 = 4
1 92 0
2 93 0
1 94 0
1 95 0
3 96 0
4 97 0
4 98 0
1 99 0
3 100 0
1 101 0
2 102 0
0 103 0
1 104 0
4 105 0
1 106 0
2 107 0
2 108 0
2 109 0
2 110 0
3 111 0
2 112 0
4 113 0
2 114 0
1 115 0
3 116 0
5 117 0
4 118 0
0 119 0
0 120 1
2 121 1
1 122 1
3 123 1 Luís Costa, Universidade de Aveiro - ISCA
1 124 1
3 125 1
1 126 1
2 127 1
1 128 1
2 129 1
0 130 1
2 131 1
0 132 1
0 133 1
1 134 1
5 135 1
1 136 1
1 137 1
1 138 1
1 139 1
3 140 1
0 141 1
2 142 1
3 143 1
1 144 1
1 145 1
0 146 1
0 147 1
1 148 1
4 149 1
3 150 1
1 151 1
2 152 1
3 153 1
4 154 1
2 155 1
1 156 1
1 157 1
3 158 1
2 159 1
3 160 1
5 161 1
1 162 1
3 163 1
1 164 1
0 165 1
1 166 1
2 167 1
1 168 1
4 169 1
0 170 1
2 171 1
1 172 1
4 173 1 Luís Costa, Universidade de Aveiro - ISCA
3 174 1
0 175 1
1 176 1
3 177 1
3 178 1
2 179 1
6 180 1
1 181 1
3 182 1
2 183 1
3 184 1
2 185 1
1 186 1
2 187 1
3 188 1
2 189 1
4 190 1
2 191 1
4 192 1
3 193 1
2 194 1
1 195 1
4 196 1
2 197 1
3 198 1
0 199 1
3 200 1
5 201 1
4 202 1
3 203 1
2 204 1
3 205 1
1 206 1
2 207 1
3 208 1
4 209 1
2 210 1
1 211 1
1 212 1
0 213 1
3 214 1
5 215 1
3 216 1
2 217 1
3 218 1
0 219 1
2 220 1
1 221 1
4 222 1
1 223 1 Luís Costa, Universidade de Aveiro - ISCA
2 224 1
2 225 1
6 226 1
0 227 1
1 228 1
1 229 1
4 230 1
1 231 1
3 232 1
4 233 1
1 234 1
2 235 1
3 236 1
1 237 1
1 238 1
2 239 1
2 240 1
4 241 1  x np : n + x np + 1 : n
 ⇐ np ∈ N
7 242 1  2
1 243 1 Q p = 
6 244 1 x ⇐ np ∉ N
0 245 1  [np ]+ 1 : n

2 246 1
3 247 1
5 248 1 [ Cálculo associado a 3 (e) (Determinação do primeiro
3 249 1 quartil.). ]
0 250 1 Tem-se np= 1000*0,25=250.

3 251 1 Tem-se np=1000*0,25=250 .


2 252 1 Como np é um número natural, conclui-se que
2 253 1 Q 0.25 =(x 250:1000 +x 251:1000 )/2=(1+1)/2=1.
3 254 1
5 255 1
4 256 1
4 257 1
0 258 1
5 259 1
3 260 1
5 261 1
4 262 1
3 263 1
2 264 1
1 265 1
2 266 1
2 267 1
3 268 1
3 269 1
4 270 1
1 271 1
2 272 1 Luís Costa, Universidade de Aveiro - ISCA
3 273 1
4 274 1
3 275 1
1 276 1
2 277 1
2 278 1
1 279 1
4 280 1
4 281 1
5 282 1
5 283 1
3 284 1
2 285 1
2 286 1
0 287 1
0 288 1
3 289 1
2 290 1
2 291 1
2 292 1
0 293 1
3 294 1
1 295 1
1 296 1
2 297 1
7 298 1
2 299 1
6 300 1
3 301 1
2 302 1
1 303 1
6 304 1
1 305 1
1 306 1
3 307 1
0 308 1
2 309 1
0 310 1
4 311 1
3 312 1
4 313 1
2 314 1
2 315 1
5 316 1
5 317 1
5 318 1
1 319 1
1 320 1
2 321 1
5 322 1 Luís Costa, Universidade de Aveiro - ISCA
1 323 1
2 324 1
1 325 1
1 326 1
1 327 1
0 328 1
1 329 1
2 330 1
5 331 1
3 332 1
3 333 1
3 334 1
3 335 1
2 336 1
3 337 1
3 338 1
0 339 1
0 340 1
2 341 1
4 342 1
2 343 1
1 344 1
3 345 1
0 346 1
2 347 1
3 348 1
1 349 1
5 350 1
2 351 1
0 352 1
2 353 1
0 354 1
0 355 1
2 356 1
1 357 1
2 358 1
1 359 1
4 360 1
0 361 1
6 362 1
2 363 1
1 364 1
4 365 1
1 366 1
2 367 1
1 368 1
4 369 1
3 370 1
2 371 1
2 372 1 Luís Costa, Universidade de Aveiro - ISCA
3 373 1
3 374 1
2 375 1
4 376 1
2 377 1
3 378 1
1 379 1
3 380 1
3 381 1
5 382 1
2 383 1
0 384 1
2 385 1
2 386 1
0 387 1
1 388 1
5 389 1
0 390 1
2 391 1
1 392 1
4 393 1
3 394 1
2 395 2
1 396 2
2 397 2
4 398 2
1 399 2
1 400 2
3 401 2
2 402 2
1 403 2
1 404 2
1 405 2
2 406 2
3 407 2
1 408 2
1 409 2
3 410 2
2 411 2
6 412 2
1 413 2
4 414 2
3 415 2
1 416 2
2 417 2
5 418 2
3 419 2
3 420 2
2 421 2
1 422 2 Luís Costa, Universidade de Aveiro - ISCA
0 423 2
2 424 2
5 425 2
4 426 2
1 427 2
3 428 2
1 429 2
0 430 2
4 431 2
5 432 2
1 433 2
4 434 2
3 435 2
1 436 2
4 437 2
4 438 2
0 439 2
1 440 2
1 441 2
0 442 2
2 443 2
4 444 2
1 445 2
2 446 2
4 447 2
1 448 2
3 449 2
0 450 2
4 451 2
2 452 2
3 453 2
2 454 2
4 455 2
1 456 2
3 457 2
5 458 2
3 459 2
3 460 2
4 461 2
3 462 2
3 463 2
0 464 2
1 465 2
2 466 2
0 467 2
0 468 2
1 469 2
3 470 2
4 471 2
1 472 2 Luís Costa, Universidade de Aveiro - ISCA
3 473 2
2 474 2
1 475 2
2 476 2
4 477 2
3 478 2
1 479 2
1 480 2
1 481 2
3 482 2
3 483 2
2 484 2
3 485 2
2 486 2
2 487 2
3 488 2
1 489 2
2 490 2
2 491 2
3 492 2
2 493 2
0 494 2
3 495 2
2 496 2
2 497 2
2 498 2
1 499 2
1 500 2
1 501 2
1 502 2
2 503 2
1 504 2
1 505 2
3 506 2
0 507 2
3 508 2
0 509 2
1 510 2
2 511 2
2 512 2
3 513 2
4 514 2
0 515 2
4 516 2
4 517 2
2 518 2
2 519 2
0 520 2
3 521 2
2 522 2 Luís Costa, Universidade de Aveiro - ISCA
0 523 2
1 524 2
2 525 2
2 526 2
2 527 2
3 528 2
2 529 2
0 530 2
1 531 2
2 532 2
0 533 2
2 534 2
0 535 2
2 536 2
2 537 2
1 538 2
1 539 2
2 540 2
2 541 2
4 542 2
2 543 2
1 544 2
1 545 2
4 546 2
2 547 2
1 548 2
4 549 2
2 550 2
2 551 2
3 552 2
1 553 2
2 554 2
3 555 2
0 556 2
3 557 2
4 558 2
2 559 2
1 560 2
0 561 2
6 562 2
1 563 2
3 564 2
3 565 2
1 566 2
0 567 2
2 568 2
1 569 2
3 570 2
1 571 2
0 572 2 Luís Costa, Universidade de Aveiro - ISCA
3 573 2
1 574 2
2 575 2
2 576 2
4 577 2
1 578 2
3 579 2
2 580 2
3 581 2
2 582 2
1 583 2
9 584 2
2 585 2
0 586 2
1 587 2
2 588 2
3 589 2
2 590 2
4 591 2
3 592 2
3 593 2
1 594 2
1 595 2
2 596 2
3 597 2
4 598 2
5 599 2
1 600 2
3 601 2
3 602 2
1 603 2
0 604 2
2 605 2
2 606 2
3 607 2
4 608 2
2 609 2
1 610 2
1 611 2
3 612 2
0 613 2
7 614 2
1 615 2
6 616 2
3 617 2
0 618 2
2 619 2
2 620 2
2 621 2
0 622 2 Luís Costa, Universidade de Aveiro - ISCA
0 623 2
1 624 2
2 625 2
0 626 2
2 627 2
4 628 2
3 629 2
2 630 2
0 631 2
2 632 2
2 633 2
2 634 2
6 635 2
3 636 2
0 637 2
0 638 2
1 639 2
1 640 2
4 641 2
3 642 2
3 643 2
1 644 2
3 645 2
1 646 2
2 647 2
3 648 2
3 649 2
5 650 2
3 651 2
1 652 2
2 653 2
4 654 2
2 655 2
1 656 2
1 657 2
1 658 2
4 659 2
2 660 2
2 661 2
2 662 2
0 663 2
2 664 2
3 665 3
4 666 3
2 667 3
1 668 3
6 669 3
1 670 3
1 671 3
0 672 3 Luís Costa, Universidade de Aveiro - ISCA
2 673 3
1 674 3
0 675 3
2 676 3
2 677 3
2 678 3
1 679 3
3 680 3
3 681 3
0 682 3
3 683 3
1 684 3
1 685 3
3 686 3
1 687 3
4 688 3
2 689 3
1 690 3
2 691 3
2 692 3
3 693 3
1 694 3
1 695 3
2 696 3
4 697 3
2 698 3
2 699 3
3 700 3
1 701 3
4 702 3
3 703 3
1 704 3
0 705 3
0 706 3
5 707 3
5 708 3
1 709 3
2 710 3
1 711 3
4 712 3
1 713 3
0 714 3
4 715 3
3 716 3
2 717 3
1 718 3
2 719 3
1 720 3
2 721 3
2 722 3 Luís Costa, Universidade de Aveiro - ISCA
1 723 3
2 724 3
1 725 3
0 726 3
1 727 3
1 728 3
3 729 3
1 730 3
1 731 3
3 732 3
1 733 3
4 734 3
4 735 3
2 736 3
0 737 3
2 738 3
3 739 3
2 740 3
2 741 3
1 742 3
4 743 3
4 744 3
2 745 3
3 746 3
5 747 3
2 748 3 [ Cálculo associado a 3 (e) (Determinação do terceiro quartil,
1 749 3 intervalo interquartis e amplitude interquartis.). ]
3 750 3 Tem-se np=1000*0,75=750 .
1 751 3 Como np é um número natural, conclui-se que Q 0.75 = 3.
1 752 3 Q 0.75 = (x 750:1000 +x 751:1000 )/2=(3+3)/2=3.
1 753 3 Dado que Q 0.25 = 1 e Q 0.75 = 3 , conclui-se que o intervalo
3 754 3 interquartis consiste em [ 1 , 3 ] , pelo que a amplitude
1 755 3 interquartis vale r q = 3 - 1 = 2 (erros).
2 756 3
1 757 3
3 758 3
2 759 3
3 760 3
1 761 3
2 762 3
0 763 3
1 764 3
1 765 3
1 766 3
6 767 3
4 768 3
6 769 3
2 770 3
0 771 3
0 772 3 Luís Costa, Universidade de Aveiro - ISCA
0 773 3
1 774 3
2 775 3
2 776 3
5 777 3
1 778 3
1 779 3
4 780 3
5 781 3
0 782 3
2 783 3
0 784 3
2 785 3
3 786 3
0 787 3
2 788 3
3 789 3
2 790 3
3 791 3
2 792 3
0 793 3
1 794 3
4 795 3
3 796 3
1 797 3
1 798 3
2 799 3
1 800 3
1 801 3
0 802 3
2 803 3
1 804 3
1 805 3
3 806 3
2 807 3
3 808 3
3 809 3
3 810 3
0 811 3
1 812 3
0 813 3
3 814 3
1 815 3
2 816 3
1 817 3
2 818 3
2 819 3
1 820 3
2 821 3
2 822 3 Luís Costa, Universidade de Aveiro - ISCA
5 823 3
3 824 3
2 825 3
1 826 3
3 827 3
1 828 3
0 829 3
0 830 3
1 831 3
2 832 3
1 833 3
2 834 3
1 835 3
0 836 3
2 837 3
2 838 3
2 839 3
0 840 3
1 841 3
0 842 3
2 843 3
1 844 3
2 845 3
2 846 4
1 847 4
1 848 4
2 849 4
1 850 4
2 851 4
4 852 4
1 853 4
1 854 4
5 855 4
3 856 4
0 857 4
1 858 4
1 859 4
2 860 4
1 861 4
3 862 4
2 863 4
1 864 4
0 865 4
2 866 4
5 867 4
3 868 4
2 869 4
3 870 4
3 871 4
2 872 4 Luís Costa, Universidade de Aveiro - ISCA
4 873 4
1 874 4
2 875 4
0 876 4
1 877 4
1 878 4
1 879 4
3 880 4
2 881 4
2 882 4
1 883 4
2 884 4
1 885 4
0 886 4
1 887 4
3 888 4
5 889 4
2 890 4
0 891 4
3 892 4
1 893 4
1 894 4
2 895 4
3 896 4
1 897 4
0 898 4 [ Cálculo e raciocínio associados a 3 (f). ]
2 899 4
3 900 4 Tem-se np =900.
4 901 4 Como np é um número natural, conclui-se que Q 0.9 = 4.
1 902 4 Tal significa que 0,90*100=90 % das observações assu-
1 903 4 mem valor inferior ou igual a 4 (erros), pelo que 10% das
2 904 4 observações assumem valor superior a 4 (erros).
4 905 4
2 906 4
2 907 4
4 908 4
0 909 4
2 910 4
1 911 4
1 912 4
5 913 4
1 914 4
2 915 4
3 916 4
2 917 4
2 918 4
2 919 4
2 920 4
2 921 4
1 922 4 Luís Costa, Universidade de Aveiro - ISCA
4 923 4
6 924 4
3 925 4
1 926 4
3 927 4
1 928 4
1 929 4
2 930 4
1 931 4
1 932 4
3 933 4
6 934 4
1 935 4
5 936 4
1 937 4
1 938 5
1 939 5
0 940 5
2 941 5
0 942 5
2 943 5
2 944 5
0 945 5
3 946 5
2 947 5
1 948 5
2 949 5
3 950 5
0 951 5
1 952 5
1 953 5
5 954 5
2 955 5
2 956 5
0 957 5
0 958 5
2 959 5
0 960 5
2 961 5
1 962 5
1 963 5
0 964 5
0 965 5
4 966 5
3 967 5
2 968 5
3 969 5
2 970 5
0 971 5
4 972 5 Luís Costa, Universidade de Aveiro - ISCA
2 973 5
1 974 5
3 975 5
1 976 5
1 977 5
6 978 5
1 979 6
1 980 6
4 981 6
3 982 6
1 983 6
4 984 6
3 985 6
1 986 6
0 987 6
5 988 6
2 989 6
3 990 6
1 991 6
2 992 6
2 993 6
2 994 6
2 995 6
1 996 6 1214
6 997 7 1215
2 998 7 1216
2 999 7 1217
1 1000 9 1218
Quadro de Frequências
xi ni Ni fi Fi
0 119 119 0,119 0,119
1 275 394 0,275 0,394
2 270 664 0,270 0,664
3 181 845 0,181 0,845
4 92 937 0,092 0,937
5 41 978 0,041 0,978
6 18 996 0,018 0,996
7 3 999 0,003 0,999
9 1 1000 0,001 1,000
(Dimensão da amostra) n= 1000

Tabela auxiliar destinada à obtenção do gráfico de barras:


1234 Gráfico de Barras (correspondente à distribuição de frequências relativas)
1235 0 0,119
1236 1 0,275
2 0,270
3 0,181
4 0,092
5 0,041
6 0,018
1242 7 0,003
1243 9 0,001 Luís Costa, Universidade de Aveiro - ISCA
C D
O gráfico de barras associado à amostra em estudo é resultante do procedimento seguinte:
Criar tabela auxiliar (com a forma anterior) -> Selecionar o domínio C1234:D1243 ->
Inserir gráfico "Coluna 2D" -> Apagar legenda à direita, quando esta aparece.

Gráfico de Barras (correspondente à distribuição de


frequências relativas)
0,300
0,250
0,200
0,150
0,100
0,050
0,000
0 1 2 3 4 5 6 7 9

Determinação da média amostral:


C D E
1262 xi ni nixi
1263 0 119 0 Editar =D1263*C1263
1264 1 275 275 (Estender a instrução às restantes células.)
2 270 540 k
3
4
181
92
543
368
x=
1
n ∑n x
i =1
i i

5 41 205 9

1270
6
7
18
3
108
21
x =
1
1000 ∑i =1
ni xi

1271 9 1 9 (k : número de distintas observações da amostra.)


1272 Soma: 2069 Editar =SOMA(E1263:E1271)
Média amostral: 2,069 (erros) Editar =E1272/1000

Medidas obtidas utilizando o complemento "Análise de Dados" do Excel:


Fazendo uso do seguinte procedimento,
Dados -> Análise de Dados -> Ativar "Estatística Descritiva" -> OK ->
Intervalo de entrada (Selecionar domínio que contém a amostra em estudo.) ->
Intervalo de saída (Selecionar uma célula onde se vai dar a colagem do canto
superior esquerdo da folha de resultados.) -> Ativar "Estatísticas de sumário" -> OK ,
obtemos o conjunto de medidas que constam do quadro que se segue.

Coluna1
Média 2,069 Média amostral
Erro-padrão 0,045589
Mediana 2
Moda 1
Desvio-padrão 1,441637 Desvio padrão corrigido
Variância da amostra2,078317 Variância corrigida
Curtose 0,572087 Coeficiente de curtose
Assimetria 0,748826 Coeficiente de assimetria
Intervalo 9 Amplitude amostral
Mínimo 0 Observação mínima
Máximo 9 Observação máxima
Soma 2069 Luís Costa, Universidade de Aveiro - ISCA
Contagem 1000 Dimensão amostral
(a)

Verdadeira A barra mais elevada corresponde ao número de textos encontrados


com um erro.

(b)

Em média, os alunos universitários dão __2__ erros.

(c)

O facto de a moda ser inferior à média amostral está de acordo com o


valor do coeficiente de assimetria, que é positivo.
(O coeficiente de assimetria vale, aproximadamente, 0,749.)

(d)

A amplitude amostral é r = __ 9__ (erros).

(e)

A amplitude interquartis é rq = __ 2__ (erros).

(f)

Face ao valor do percentil de ordem 0.9, podemos dizer que apenas 10%
dos textos observados apresentam mais de __4__ erros.

____________________________________________________________________________________________

Exercício 2.4

Para um conjunto de dados qualitativos, qual das medidas de tendência central faz sentido
calcular?
A. Média B. Mediana C. Moda •

As medidas de localização média e mediana envolvem cálculos, que só têm significado quando
as observações da amostra em estudo (dados) são representadas por números, e não por
qualidades. Acresce que, quando se dispõe de uma amostra discreta de uma variável qualitativa
(ou seja, um conjunto de dados qualitativos), a medida de localização Moda possui significado,
pois exige, apenas, a identificação da observação correspondente à maior frequência.

____________________________________________________________________________________________

Luís Costa, Universidade de Aveiro - ISCA


Exercício 2.5

Peso das malas (kg)


2,00 [ Cálculos auxiliares associados à definição das classes a adotar. ]
3,00
4,00
5,00 Regra de Sturges: L = [1+ln(n)/ln(2)] ≈ 7
5,00
7,00 Adotamos 7 classes.
10,00
11,00 Amplitude de cada classe:
12,00 h = Amplitude amostral/Número de classes = 28/7 = 4 (kg)
15,04
15,12 Classes consideradas:
15,18
15,22 [2,6]
15,54 ] 6 , 10 ]
15,61 ] 10 , 14 ]
15,71 ] 14 , 18 ]
15,95 ] 18 , 22 ]
16,01 ] 22 , 26 ]
16,14 ] 26 , 30 ]
16,22
16,29 Medidas obtidas utilizando o complemento "Análise de Dados" do Excel:
16,40 Coluna1
16,79
16,85 Média 18,98762658
17,02 Erro-padrão 0,498266979
17,28 Mediana 19,76928007
17,45 Moda 5
17,49 Desvio-padrão4,982669795
17,58 Variância da 24,82699828
amostra
17,76 Curtose 2,872109016
17,99 Assimetria -1,42814653 .) Selecionar domínio F1392:F1398.
18,06 Intervalo 28 ..) Editar =FREQUÊNCIA(B1351:B1450;E1392:E1398).
18,08 Mínimo 2 …) Ctrl+Shift+Enter
18,13 Máximo 30
18,25 Soma 1898,762658 .) Selecionar célula G1392.
18,29 Contagem 100 ..) Editar =FREQUÊNCIA(B$1351:B$1450;E1392:E$1398).
18,39 ...) Estender a instrução às restantes células.
18,42 D E F G H I
18,49 b i : representação genérica dos limites superiores das classes.
18,71 Quadro de Frequências
18,75 1391 Classes bi ni Ni fi Fi
18,88 1392 [2,6] 6 5 5 0,05 0,05
18,89 ] 6 , 10 ] 10 2 7 0,02 0,07
18,92 ] 10 , 14 ] 14 2 9 0,02 0,09
18,93 ] 14 , 18 ] 18 22 31 0,22 0,31
18,94 ] 18 , 22 ] 22 43 74 0,43 0,74
19,27 1397 ] 22 , 26 ] 26 24 98 0,24 0,98
19,40 1398 ] 26 , 30 ] 30 2 100 0,02 1,00
19,67 Luís Costa, Universidade de Aveiro - ISCA
19,73
19,81
19,88
19,99 E F
20,01
20,06 Histograma (referente à distribuição de frequências relativas) 1405
20,48 [2,6] 0,05 1406
20,57 ] 6 , 10 ] 0,02
20,62 ] 10 , 14 ] 0,02
20,78 ] 14 , 18 ] 0,22
20,85 ] 18 , 22 ] 0,43
20,94 ] 22 , 26 ] 0,24 1411
20,95 ] 26 , 30 ] 0,02 1412
20,97
21,06 O histograma associado à distribuição em estudo é resultante do procedimento seguinte:
21,16 Criar tabela auxiliar (com a forma anterior) -> Selecionar o domínio E1405:F1412 ->
21,20 Inserir gráfico "Coluna 2D" -> Formatar série de dados -> definir a "Largura do intervalo"
21,33 como sendo 0% -> Apagar legenda à direita, quando esta aparece.
21,48
21,55
Histograma (referente à distribuição de frequências
21,67 relativas)
21,81
21,90 0,50

21,96 0,40
22,00
0,30
22,02
22,25 0,20
22,36 0,10
22,61
22,81 0,00
[2,6] ] 6 , 10 ] ] 10 , 14 ] ] 14 , 18 ] ] 18 , 22 ] ] 22 , 26 ] ] 26 , 30 ]
22,85
22,90
22,91
22,91
22,92
22,93
22,93
22,95
23,42
23,45
23,74
23,82
24,27
24,43
24,53
24,92
24,93
25,00
25,00
27,00
30,00
____________________________________________________________________________________________
Luís Costa, Universidade de Aveiro - ISCA
Exercício 2.6

1985 X Ordem
setembro 467 1
novembro 496 2
fevereiro 498 3
outubro 512 4
janeiro 522 5
dezembro 525 6
abril 586 7
agosto 610 8
março 643 9
julho 671 10
junho 933 11

1986 Y Ordem
setembro 445 1
outubro 448 2
agosto 477 3
junho 481 4
julho 486 5
novembro 519 6
fevereiro 527 7
maio 536 8
abril 538 9
dezembro 540 10
janeiro 545 11
X Y
Coluna1 Coluna1

Média 587,5454545 Média 503,8181818


Erro-padrão 39,85550347 Erro-padrão 11,3256091
Mediana 525 Mediana 519
Moda #N/D Moda #N/D
Desvio-padrão132,1857508 Desvio-padrão37,56279591 Desvio padrão corrigido
Variância da 17473,07273
amostra Variância da amostra
1410,963636 Variância corrigida
Curtose 4,66767894 Curtose -1,40997399
Assimetria 1,99999903 Assimetria -0,47918212
Intervalo 466 Intervalo 100
Mínimo 467 Mínimo 445
Máximo 933 Máximo 545
Soma 6463 Soma 5542
Contagem 11 Contagem 11

(a)

Não ocorreu aumento do número mensal de chamadas atendidas, visto que


587 ,55 ≈ x > y ≈ 503,82 . Luís Costa, Universidade de Aveiro - ISCA
(b)

A maior dispersão relativamente à média do número mensal de chamadas atendidas dá-se no


ano 1985, dado que o desvio padrão corrigido referente à amostra associada a 1985, que vale
aproximadamente 132,19 (chamada por mês), é superior ao desvio padrão corrigido referente à
amostra associada a 1986, que vale aproximadamente 37,56 (chamadas por mês).

(c)

Determinação da mediana da amostra associada a 1985:

Como n=11 é ímpar, tem-se Me = x 11 +1 = x 6 :11 = 525 .


:11
2
Determinação da mediana da amostra associada a 1986:

Como n=11 é ímpar, tem-se Me = y 11 +1 = y 6:11 = 519 .


:11
2
Face às medianas obtidas podemos fazer o seguinte comentário interpretativo:

Uma vez que a mediana referente à amostra associada a 1985 vale 525, podemos afirmar
que 0,50*100%=50% das observações assumem um valor menor ou igual a 525 (chamadas por
mês).
Por outro lado, dado que a mediana referente à amostra associada a 1986 vale 519, podemos
afirmar que 0,50*100%=50% das observações assumem um valor menor ou igual a 519
(chamadas por mês).

(d)

Determinação do primeiro quartil da amostra associada a 1985:

Como np=11*0,25=2,75 não é um número natural, tem-se Q0.25= x[2,75]+1:11= x3:11= 498.

Determinação do terceiro quartil da amostra associada a 1985:

Como np=11*0,75=8,25 não é um número natural, tem-se Q0.75= x[8,25]+1:11= x9:11= 643.

Assim, o intervalo interquartis consiste em [ 498 , 643 ] .

Por conseguinte, a amplitude interquartis consiste em r q = 643 - 498 = 145 (chamadas por mês).

Tendo em consideração a informação acabada de obter, podemos estabelecer o comentário


seguinte:

A metade central da amostra (a mais importante) está compreendida entre 498 e 643 chamadas
por mês.
A dispersão da amostra é considerável, pois a amplitude interquartis assume um valor que não é
muito pequeno relativamente aos valores assumidos pelas observações de X .
Luís Costa, Universidade de Aveiro - ISCA
(e)

O coeficiente de assimetria referente à amostra associada a 1985 obtido com recurso ao


complemento "Análise de Dados" do Excel consiste, aproximadamente, em g = 2,00.

Em virtude de se ter g > 0, podemos deduzir que a distribuição de frequências da amostra é


assimétrica positiva.

(f) D E F
Nova amostra
1985 X Ordem X´ 1565
setembro 467 1 467 1566
novembro 496 2 496 1567
fevereiro 498 3 498 1568
outubro 512 4 512 1569
janeiro 522 5 522 1570
dezembro 525 6 525 1571
abril 586 7 586 1572
agosto 610 8 643 1573
março 643 9 671 1574
julho 671 10 933 1575
junho 933 11 Média: 585,30
Editar =media(F1566:F1575)
Nova amostra
1986 Y Ordem Y´ 1579
setembro 445 1 445 1580
outubro 448 2 448 1581
agosto 477 3 481 1582
junho 481 4 486 1583
julho 486 5 519 1584
novembro 519 6 527 1585
fevereiro 527 7 536 1586
maio 536 8 538 1587
abril 538 9 540 1588
dezembro 540 10 545 1589
janeiro 545 11 Média: 506,50
Editar =media(F1580:F1589)
Determinação da mediana da nova amostra associada a 1985:
x 10 + x 10
:10 +1:10 x5:10 + x6:10
Como n=10 é par, tem-se 522 + 525
Me = 2 2 = = = 523,50 .
2 2 2

Determinação da mediana da nova amostra associada a 1986:


y 10 + y 10
:10 +1:10 y5:10 + y6:10
Como n=10 é par, tem-se 519 + 527
Me = 2 2 = = = 523,00 .
2 2 2

Médias amostrais das novas amostras:

x = 585,30, y = 506,50 .
Luís Costa, Universidade de Aveiro - ISCA
Comparação das médias e das medianas:
1985 1986
Média Mediana Média Mediana
Amostra original 587,55 525,00 503,82 519,00
Nova amostra 585,30 523,50 506,50 523,00

Face às médias e medianas obtidas podemos fazer o seguinte comentário interpretativo:

A média e a mediana da nova amostra sofrem alterações de valor muito reduzidas, relativamente
ao valor original destas medidas.
Em particular, as pequenas variações das médias amostrais ficam a dever-se ao facto de as observações
excluídas, referentes ao mês de agosto, assumirem valores próximos das médias amostrais
originais.

____________________________________________________________________________________________

Exercício 2.8

(a) C D E F G
Quadro de Frequências
1625 Classes (meses) ni Ni fi Fi
1626 [ -6 , 0 ] 42 42 0,2400 0,2400
1627 ]0,6] 83 125 0,4743 0,7143
1628 ] 6 , 12 ] 27 152 0,1543 0,8686
1629 ] 12 , 18 ] 23 175 0,1314 1,0000

Editar = E1626+D1627
Estender a instrução anterior às restantes células.
Editar =D1626/175
Estender a instrução anterior às restantes células.
Editar =E1626/175
Estender a instrução anterior às restantes células.

Histograma (referente à distribuição de frequências relativas)


[ -6 , 0 ] 0,2400
]0,6] 0,4743
] 6 , 12 ] 0,1543
] 12 , 18 ] 0,1314

Histograma (referente à distribuição de


frequências relativas)
0,6000
0,4000
0,2000
0,0000
[ -6 , 0 ] ]0,6] ] 6 , 12 ] ] 12 , 18 ]
Luís Costa, Universidade de Aveiro - ISCA
C D
1658 Polígono de Frequências (referente à distribuição de frequências relativas)
1659 [ -6 , 0 ] 0,2400
1660 ]0,6] 0,4743
1661 ] 6 , 12 ] 0,1543
1662 ] 12 , 18 ] 0,1314

O polígono de frequências associado à distribuição em estudo é resultante do procedimento seguinte:


Criar tabela auxiliar (com a forma anterior) -> Selecionar o domínio C1658:D1662 ->
Inserir gráfico "linha 2D" -> Apagar legenda à direita, quando esta aparece.

Polígono de Frequências (referente à distribuição de


frequências relativas)
0,5000

0,4000

0,3000

0,2000

0,1000

0,0000
[ -6 , 0 ] ]0,6] ] 6 , 12 ] ] 12 , 18 ]

(b.1)

Falsa Só 10% dos diplomados inquiridos demoraram um ano ou mais a obter o primeiro emprego.

(Dado que 0,87*100%=87% dos inquiridos demoraram um ano ou menos para obter o primeiro emprego,
deduz-se que (100-87)%=13% dos inquiridos demoraram mais de um ano para obter o primeiro emprego,
donde decorre que a afirmação exposta é falsa.)

(b.2)

Falsa A percentagem de inquiridos que demoraram 9.06 meses a obter o primeiro emprego é 60%.

(Uma vez que 100*F2% = 0,71*100% = 71% dos inquiridos demoraram 6 meses ou menos para obter o
primeiro emprego, conclui-se a percentagem de inquiridos que demoraram 9.06 meses para obter o
primeiro emprego é superior a 71%, pelo que a afirmação exposta é falsa.)

(b.3)

Verdadeira A moda situa-se entre 0 e 6 meses.

(Observando que a classe modal é representada pelo intevalo ] 0 , 6 ], pois corresponde à maior frequência,
deduz-se que a moda consiste em Mo = (0+6)/2 = 3 (meses), donde decorre que a afirmação proposta é
verdadeira.) Luís Costa, Universidade de Aveiro - ISCA
(b.4)

Verdadeira (Pelo menos) 50% dos inquiridos obtiveram o primeiro emprego antes dos 6 meses.

(Uma vez que 100*F2% = 0,71*100% = 71% dos inquiridos demoraram 6 meses ou menos para obter o
primeiro emprego, percentagem esta que é superior a 50%, donde se conclui qua a afirmação apresentada
é verdadeira.)

(b.5)

[ Determinação da média amostral. ]


C D E F
1720 Classes (meses) ni x´ i n i x´ i
1721 [ -6 , 0 ] 42 -3 -126 Editar =D1721*E1721
1722 ]0,6] 83 3 249 (Estender a instrução às restantes células.)
1723 ] 6 , 12 ] 27 9 243 4

1724 ] 12 , 18 ] 23 15 345 x =
1
175 ∑ i =1
n i x i′
1725 Soma: 711
Média amostral: 4,06 (meses) Editar =F1725/175

[ Determinação da mediana. ]

A classe mediana é representada pelo intervalo ] 0 , 6 ], pois corresponde à primeira frequência


relativa acumulada superior ou igual a 0,50, que assume o valor 0,71.
Assim, por interpolação linear, obtemos

6−0 Me − 0
= ⇔ Me ≈ 3,32 (meses).
0 ,71 − 0 , 24 0 ,50 − 0 , 24

Verdadeira Trata-se de uma distribuição assimétrica positiva.

(Em virtude de se ter 3 = Mo < Me < x ≈ 4 , 06 ,


podemos concluir que a distribuição de frequências é assimétrica positiva, pelo que a afirmação
apresentada é verdadeira.)

____________________________________________________________________________________________

Exercício 2.9

X : "Duração da auditoria, expressa em horas."

X Ordem
10 1
10 2
10 3
23 4
23 5 Luís Costa, Universidade de Aveiro - ISCA
23 6
23 7
23 8 Quadro de Frequências
32 9 xi ni Ni fi Fi
32 10 10 3 3 0,06 0,06
32 11 23 5 8 0,10 0,16
32 12 32 10 18 0,20 0,36
32 13 41 12 30 0,24 0,60
32 14 55 20 50 0,40 1,00
32 15
32 16
32 17
32 18
41 19
41 20
41 21
41 22
41 23
41 24
41 25
41 26
41 27
41 28
41 29
41 30
55 31
55 32
55 33
55 34
55 35
55 36
55 37
55 38
55 39
55 40
55 41
55 42
55 43
55 44
55 45
55 46
55 47
55 48
55 49
55 50

(a)

Trata-se da função, F , tal que F (10 ) = 0,06, F (23 ) = 0,16 , F (32 ) = 0,36, F (41) = 0,60, F (55 ) = 1,00 .

Luís Costa, Universidade de Aveiro - ISCA


(b)

Fazendo uso do complemeto "Análise de Dados" do Excel, obtemos o quadro de medidas seguinte:

Coluna1

Média 41,14
Erro-padrão 1,941178
Mediana 41
Moda 55
Desvio-padrão 13,7262 Desvio padrão corrigido
Variância da amostra188,4086 Variância corrigida
Curtose -0,48288
Assimetria -0,61504
Intervalo 45
Mínimo 10
Máximo 55
Soma 2057
Contagem 50

Por conseguinte, tem-se x ≈ 41 ∧ Me = 41 ∧ Mo = 55 .

(c)

Dado que se tem 41 ≈ x < Mo = 55 ,


podemos deduzir que a distribuição de frequências é assimétrica negativa.

(d)

Dado que F(32)=0,36, somos levados a concluir que 100*0,36%=36% das observações assumem
valor não superior a 32, donde decorre que (100-36)% = 64% das observações assumem valor
superior a 32.
Assim, como as observações 41 e 55 são superiores à observação 35, pode-se inferir que
64% das durações de auditoria são superiores a 35 horas.

(e)
C D E F
1844 xi ni nixi n i* (x i -média) 2
1845 10 3 30 2909,10 Eitar = D1845*(C1845-$E$1851)^2
1846 23 5 115 1645,30
1847 32 10 320 835,40 5
1848
1849
41
55
12
20
492
1100
0,24 S 2 = 1
3841,99 50
i =1

n i (x i − x ) 2

1850 Somas: 2057 9232,02


1851 Média amostral: 41,14
S = S2
1852 Variância amostral: 184,64
1853 Desvio padrão: 13,59 (horas) Editar =F1852^0,5
Luís Costa, Universidade de Aveiro - ISCA
Observemos que, embora tal não nos seja pedido, como o coeficiente de assimetria de Pearson, que consiste

x − M0 41,14 − 55,00
em gP = ≈ ≈ -1,02 , é negativo, podemos deduzir que a distribuição de
s 13,59

frequências é assimétrica negativa.

(f)

Determinação do primeiro quartil da amostra em estudo:

Como np=50*0,25=12,50 não é um número natural, tem-se


Q0.25 = x[1 2,5 0]+1:5 0 = x1 3:5 0 = 32 .

Determinação do terceiro quartil da amostra em estudo:

Como np=50*0,75=37,50 não é um número natural, tem-se


Q0.75 = x[3 7,5 0]+1:5 0 = x3 8:5 0 = 55 .

Diagrama de Extremos e Quartis


xmáximo 55
Q0.75 55
Q0.25 32
xmínimo 10

60

50

40 xmáximo

30 Q0.75
Q0.25
20
xmínimo
10

0
Diagrama de Extremos e Quartis

____________________________________________________________________________________________
Luís Costa, Universidade de Aveiro - ISCA
Exercício 2.10

(a)
X : "Montante do empréstimo, expresso em unidades monetárias."
xi
30
30
35
35
45
45
50
50
55
55
60
60 Adotamos 6 classes.
65
70 Amplitude de cada classe:
75 h = Amplitude amostral/Número de classes = ( 300 - 30) / 6 = 45 (u.m.)
75
85 Classes consideradas:
85
90 [ 30 , 75 ]
90 ] 75 , 120 ]
95 ] 120 , 165 ]
100 ] 165 , 210 ]
100 ] 210 , 255 ]
100 ] 255 , 300 ]
110
120
120 Classes bi ni Ni fi Fi
125 [ 30 , 75 ] 75 16 16 0,400 0,400
130 Classe mediana ] 75 , 120 ] 120 11 27 0,275 0,675
140 ] 120 , 165 ] 165 7 34 0,175 0,850
150 ] 165 , 210 ] 210 4 38 0,100 0,950
150 ] 210 , 255 ] 255 1 39 0,025 0,975
160 ] 255 , 300 ] 300 1 40 0,025 1,000
165
180
190
200
200
250
300

Luís Costa, Universidade de Aveiro - ISCA


(b)

Histograma (referente à distribuição de frequências relativas)


[ 30 , 75 ] 0,400
] 75 , 120 ] 0,275
] 120 , 165 ] 0,175
] 165 , 210 ] 0,100
] 210 , 255 ] 0,025
] 255 , 300 ] 0,025

Histograma (referente à distribuição de


frequências relativas)
0,500

0,400

0,300

0,200

0,100

0,000
[ 30 , 75 ] ] 75 , 120 ] ] 120 , 165 ] ] 165 , 210 ] ] 210 , 255 ] ] 255 , 300 ]
(c)

Determinação da média amostral:

Classes x´ i ni n i x´ i
[ 30 , 75 ] 52,5 16 840,00
] 75 , 120 ] 97,5 11 1072,50
] 120 , 165 ] 142,5 7 997,50
] 165 , 210 ] 187,5 4 750,00
] 210 , 255 ] 232,5 1 232,50
] 255 , 300 ] 277,5 1 277,50
Soma: 4170,00
Média amostral: 104,25 (u.m.)

Determinação da mediana:
Identificação da classe mediana: ] 75 , 120 ]

Interpolação linear:

120 − 75 Me − 75 45 4,5
= ⇔ Me − 75 = * 0,1 ⇔ Me = 75 + ⇔ Me ≈ 91,36 (u.m.)
0,675 − 0,400 0,500 − 0,400 0,275 0,275

Determinação do terceiro quartil:

Identificação da classe que contém Q 0.75: ] 120 , 165 ]

Interpolação linear:
165 − 120 Q 0 .75 − 120 45 3,375
= ⇔ Q 0 . 75 − 120 = * 0 , 075 ⇔ Q 0 . 75 = 120 + 91,36
0 ,850 − 0 , 675 0 , 750 − 0 , 675 0 ,175 0 ,175

⇔ Q0.75 ≈ 139,29 (u.m.) Luís Costa, Universidade de Aveiro - ISCA


Determinação do desvio padrão corrigido:
C D E
2010 x´ i ni n i (x´ i -média)^2

52,5 16 42849,00 6

∑ n (x ′ − x )
2011
1
2012 97,5 11 501,19 S c2 = i i
2
40 − 1
2013 142,5 7 10241,44 i =1
2014 187,5 4 27722,25
2015 232,5 1 16448,06
2016 277,5 1 30015,56 Sc = S c2
2017 Soma: 127777,50
2018 Variância corrigida, S c2 : 3276,35 (u.m.2)
2019 Desvio padrão corrigido, S c : 57,24 (u.m.) Editar =E2018^0,5

(d)

xi Ordem
30 1 Coluna1
30 2
35 3 Média 106,75
35 4 Erro-padrão 9,891316446
45 5 Mediana 92,5
45 6 Moda 100
50 7 Desvio-padrão62,55817805 Desvio padrão corrigido
50 8 Variância da 3913,525641
amostra Variância corrigida
55 9 Curtose 1,198643764
55 10 Assimetria 1,117774662
60 11 Intervalo 270
60 12 Mínimo 30
65 13 Máximo 300
70 14 Soma 4270
75 15 Contagem 40
75 16
85 17
85 18 [ Determinação do primeiro quartil. ]
90 19
90 20 Tem-se np=40*0,25=10 .
95 21 Como np é um número natural, conclui-se que
100 22 Q 0.25 = (x 10:40 +x 11:40 )/2=(55+60)/2=57,5.
100 23
100 24
110 25
120 26 [ Determinação do terceiro quartil. ]
120 27
125 28 Tem-se np=40*0,75=30 .
130 29 Como np é um número natural, conclui-se que
140 30 Q 0.75 = (x 30:40 +x 31:40 )/2=(140+150)/2=145.
150 31
150 32
160 33 Luís Costa, Universidade de Aveiro - ISCA
165 34
180 35
190 36
200 37
200 38
250 39
300 40

Diagrama de Extremos e Quartis


xmáximo 300 350
Q0.75 145 300
Q0.25 57,5
250
xmínimo 30
200

150

100

50

0
Diagrama de Extremos e Quartis

(e)

As diferenças existentes entre as medidas, média amostral, mediana, desvio padrão


corrigido e terceiro quartil, obtidas no contexto de classificação de dados (caso contínuo),
em (c), e as mesmas medidas obtidas no contexto em que se considera a amostra original (caso
discreto) são justificadas pelas aproximações que se fazem quando se considera que as
observações pertencentes a cada classe são tomadas, em termos calculatórios, como sendo,
todas, iguais à marca de tal classe.

(f)

Identificação da classe que contém 180: ] 165 , 210 ]


Interpolação linear: (Admite-se que p é a frequência relativa acumulada correspondente a 180.)

p − 0 ,850 0 , 950 − 0 , 850 1, 5 1, 5


= ⇔ p − 0 , 850 = ⇔ p = 0 , 850 + ⇔ p ≈ 0,88
91,36
180 − 165 210 − 165 45 45

Por conseguinte, cerca de 100*0,88%=88% das observações assumem valor inferior ou igual
a 180 (u.m.).
Daqui decorre que 40*0,88 = 35,2 das observações, aproximadamente, assumem
valor inferior ou igual a 180 (u.m.).
Tal significa que existem, aproximadamente, 35 empréstimos de valor inferir ou igual a 180
unidades monetárias. Luís Costa, Universidade de Aveiro - ISCA
____________________________________________________________________________________________
Exercício 3.1
Y X W
Vinho Preço ParkerPoints CoatesPoints
Lafite 2850 100 19,5
Latour 2850 98 18,5
Margaux 2900 100 19,5
Mouton 2500 97 17
Haut Brion 2500 98 18,5
Cheval Blanc 3650 100 19,5
Ausone 4200 100 18,5
Petrus 10500 100 18,5
Pichon-Lalande 880 97 16,5
Pichon-Baron 550 96 17,5
Duhart-Milon 210 90 16
Batailley 150 87 15,5
Haut-Batailley 180 90 16,5
Grand-Puy-Lacoste 380 92 18
Lynch-Bages 620 95 16
Pontet-Canet 330 92 16,5
D'Armailhac 210 91 15,5
Clerc-Millon 225 91 16
Leoville-Las-Cases 1300 100 18,5
Leoville-Poyferre 465 95 17,5
Leoville-Barton 780 96 18,5
Gruaud-Larose 520 94 17
Ducru-Beaucaillou 680 94 18,5
Lagrange 260 93 15
Langoa-Barton 240 91 17
Saint-Pierre 180 89 16,5
Talbot 330 90 17
Beychevelle 240 91 16,5
Rauzan-Segla 420 90 17,5
Durfort-Vivens 180 88 17
Lascombes 230 90 17
Brane-Cantenac 255 92 16,5
Malescot 275 92 18
Palmer 900 95 18
Prieure-Lichine 180 88 15
Montrose 560 97 17,5
Calon-Segur 500 95 17,5
Haut-Marbuzet 225 87 17
Haut-Bailly 265 90 17,5
Domaine de Chevalier 260 90 18
La Mission Haut-Brion 2500 100 18
Pape-Clement 380 95 17
La Tour Haut-Brion 310 92 17
Angelus 980 96 18
Beau-Sejour-Becot 380 93 17
Beausejour 450 92 17,5 Luís Costa, Universidade de Aveiro - ISCA
Belair 250 87 16,5
Canon 360 89 18
Clos Fourtet 325 90 15
Figeac 520 93 18
La Gaffeliere 280 90 15,5
Magdelaine 350 92 18
Pavie 1600 100 14,5
Trottevieille 250 89 15
La Mondotte 2400 98 18
Troplong-Mondot 450 96 17,5
Pavie-Macquin 520 95 17,5
Tertre-Roteboeuf 1300 96 17,5
De Valandraud 1620 93 16,5
Trotanoy 800 92 18,5
La Fleur-Petrus 500 95 18
Latour-a-Pomerol 350 91 17,5
Vieux, Ch, Certan 840 94 18
Certran de May 550 91 16
La Conseillante 1250 96 17,5
L'Evangile 1500 96 18
Le Pin 10500 98 17,5
Lafleur 5000 100 18
Gazin 300 90 16
Clinet 700 92 15,5
L'Eglise-Clinet 1400 96 18
Clos L'Eglise 1220 96 17

(a)
C D
ParkerPoints CoatesPoints
X (variável independente)W (variável dependente)
2189 100 19,5
2190 98 18,5
2191 100 19,5
2192 97 17
2193 98 18,5
2194 100 19,5
2195 100 18,5
2196 100 18,5
2197 97 16,5
2198 96 17,5
2199 90 16
2200 87 15,5
2201 90 16,5
2202 92 18
2203 95 16
2204 92 16,5
2205 91 15,5
2206 91 16
2207 100 18,5
2208 95 17,5 Luís Costa, Universidade de Aveiro - ISCA
2209 96 18,5
2210 94 17
2211 94 18,5
2212 93 15
2213 91 17
2214 89 16,5
2215 90 17
2216 91 16,5
2217 90 17,5
2218 88 17
2219 90 17
2220 92 16,5
2221 92 18
2222 95 18
2223 88 15
2224 97 17,5
2225 95 17,5
2226 87 17
2227 90 17,5
2228 90 18
2229 100 18
2230 95 17
2231 92 17
2232 96 18
2233 93 17
2234 92 17,5
2235 87 16,5
2236 89 18
2237 90 15
2238 93 18
2239 90 15,5
2240 92 18
2241 100 14,5
2242 89 15
2243 98 18
2244 96 17,5
2245 95 17,5
2246 96 17,5
2247 93 16,5
2248 92 18,5
2249 95 18
2250 91 17,5
2251 94 18
2252 91 16
2253 96 17,5
2254 96 18
2255 98 17,5
2256 100 18
2257 90 16
2258 92 15,5
2259 96 18
2260 96 17
Luís Costa, Universidade de Aveiro - ISCA
Instrução Excel destinada a obter o coeficiente de correlação linear, R :
Editar "=CORREL(Domínio de células que contém a amostra da variável independente (explicativa);
Domínio de células que contém a amostra da variável dependente (explicada))".

R= 0,548 =CORREL(C2189:C2260;D2189:D2260)

Assim, a resposta a (a) consiste em:

O valor do coeficiente de correlação linear entre x e w, R , vale aproximadamente __0,548__.


(regressão linear de w sobre x)
Alternativamente, podemos obter, além do mais, o coeficiente de correlação linear fazendo uso do
procedimento que se segue.

Procedimento correspondente à obtenção de medidas correspondentes à regressão linear:

Dados -> Análise de Dados -> Regressão -> OK -> Inserir "Intervalo Y" (variável dependente) ->
Inserir "Intervalo X" (variável independente) -> Ativar "Intervalo de saída", inserindo a localização da célula
de colagem do canto superior esquerdo da folha de resultados -> OK.

SUMÁRIO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,548 Coeficiente de correlação linear, R.
Quadrado de R 0,300 Índice de correlação linear, R 2.
Quadrado de R ajustado 0,290 ( O coeficiente de correlação linear, R, é positivo, visto que este deve
Erro-padrão 0,948 possuir o mesmo sinal que o coeficiente de regressão linear, βˆ . )
Observações 72
α̂ : ordenada na origem.
ANOVA βˆ : coeficiente de regressão linear.
gl SQ MQ F F de significância
Regressão 1 27,0047 27,00470385 30,048873 6,26538E-07
Residual 70 62,90849 0,898692723
Total 71 89,91319

Coeficientes Erro-padrão Stat t valor P 95% inferior 95% superior Inferior 95,0%
Interceptar
( αˆ ≈ )
1,808 2,81299 0,642561026 0,5226081 -3,80281399 7,41785 -3,80281
X
( βˆ ≈ ) 0,164 0,030008 5,48168527 6,265E-07 0,104646136 0,224345 0,104646
αˆ ≈ 1,808, βˆ ≈ 0,164, yˆ = 1,808 + 0,164 x ( equação da reta de regressão linear ).
(b)

Verdadeira O valor do coeficiente de correlação linear significa que as classificações dos dois enólogos
estão positivamente correlacionadas.
( Uma vez que R , que vale aproximadamente 0,548, pertence ao intervalo ]0,1],
conclui-se que as classificações atribuídas pelos enólogos, ou seja as variáveis x e w , variam
no mesmo sentido, o que equivale a dizer-se que estão positivamente correlacionadas. )

(c)

Verdadeira O valor do coeficiente de correlação linear significa que existe uma associação linear entre as
classificações dos dois enólogos. Luís Costa, Universidade de Aveiro - ISCA
( Dado que R não é nulo, existe associação linear entre x e w . )
(d)

Procedimento correspondente à obtenção de um Diagrama de Dispersão:


Selecionar uma tabela auxiliar, constituída por duas colunas, a primeira associada à variável
independente e a segunda associada à variável dependente, e uma célula adicional sobre a segunda
coluna (Título) -> Inserir -> Dispersão -> Apagar legenda à direita, quando esta aparece.

ParkerPoints Preço
(Variável independente (explicativa)) X Y (Variável dependente (explicada))
Diagrama de Dispersão, Y(X)
100 2850
98 2850
100 2900
97 2500
98 2500
100 3650
100 4200
100 10500
97 880
96 550
90 210
87 150
90 180
92 380
95 620
92 330
91 210
91 225
100 1300
95 465
96 780
94 520
94 680
93 260
91 240
89 180
90 330
91 240
90 420
88 180
90 230
92 255
92 275
95 900
88 180
97 560
95 500
87 225
90 265
90 260
100 2500
95 380
92 310
96 980
93 380
92 450
87 250
89 360 Luís Costa, Universidade de Aveiro - ISCA
90 325
93 520
90 280
92 350
100 1600
89 250
98 2400
96 450
95 520
96 1300
93 1620
92 800
95 500
91 350
94 840
91 550
96 1250
96 1500
98 10500
100 5000
90 300
92 700
96 1400
96 1220

Diagrama de Dispersão, Y(X)


12000
10000
8000
6000
4000
2000
0
85 90 95 100 105

Procedimento correspondente à obtenção da representação gráfica e analítica da reta de regressão linear:


Clicar sobre um marcador no diagrama de dispersão -> Adicionar linha de tendência
-> Ativar opção "linear" -> Ativar as opções "Mostrar equação no gráfico." e "Mostrar o valor de R 2
no gráfico." -> Fechar.

Ajustamento do modelo linear, Y(X)


12000
10000
8000
6000
y = 305,92x - 27473
4000
R² = 0,3704
2000
0
-2000 85 90 95 100 105

Luís Costa, Universidade de Aveiro - ISCA


Assim, a equação definidora da reta de regressão consiste em __y = 305,92x - 27473__.

(e)

CoatesPoints Preço
(Variável independente (explicativa)) w Y (Variável dependente (explicada))
Diagrama de Dispersão, Y(W)
19,5 2850
18,5 2850
19,5 2900
17 2500
18,5 2500
19,5 3650
18,5 4200
18,5 10500
16,5 880
17,5 550
16 210
15,5 150
16,5 180
18 380
16 620
16,5 330
15,5 210
16 225
18,5 1300
17,5 465
18,5 780
17 520
18,5 680
15 260
17 240
16,5 180
17 330
16,5 240
17,5 420
17 180
17 230
16,5 255
18 275
18 900
15 180
17,5 560
17,5 500
17 225
17,5 265
18 260
18 2500
17 380
17 310
18 980
17 380
17,5 450 Luís Costa, Universidade de Aveiro - ISCA
16,5 250
18 360
15 325
18 520
15,5 280
18 350
14,5 1600
15 250
18 2400
17,5 450
17,5 520
17,5 1300
16,5 1620
18,5 800
18 500
17,5 350
18 840
16 550
17,5 1250
18 1500
17,5 10500
18 5000
16 300
15,5 700
18 1400
17 1220

Diagrama de Dispersão, Y(W)


12000
10000
8000
6000
4000
2000
0
0 5 10 15 20 25

Ajustamento do modelo de regressão linear, Y(W)


12000
10000
8000
6000
4000 y = 618,87x - 9472,6
2000 R² = 0,1366

0
0 5 10 15 20 25
-2000
Luís Costa, Universidade de Aveiro - ISCA
Assim, a equação definidora da reta de regressão linear consiste em __y = 618,87x - 9472,6__.

(f)

Face à informação obtida em (a), no quadro de "Estatística de Regressão", a resposta à questão em


estudo é a seguinte:

O valor do índice de correlação relativo à equação da reta de regressão linear de w sobre x é


__R2 = 0,300__.

(g)

Falsa A variabilidade nos preços é explicada em maior percentagem pelo modelo de regressão linear
relativo às classificações do enólogo Coates.

( Uma vez que o índice de correlação linear, R 2 , referente à reta de regressão linear do preço, y, sobre
a classificação do enólogo Parker, x, que vale aproximadamente 0,3704, é superior ao índice de correlação
linear, R2,referente à reta de regressão linear do preço, y, sobre a classificação do enólogo CoatesParker, w,
que vale aproximadamente 0,1366, podemos concluir que o melhor ajustamento linear é o primeiro.
Com efeito, 0,3704*100%=37,04% da variação do preço, y, é explicada pela variação da classificação do
enólogo Parker, x.
Por outro lado, 0,1366*100%=13,66% da variação do preço, y, é explicada pela variação da classificação do
enólogo Coates, w. )

(h)

CoatesPoints Preço
(Variável independente (explicativa)) w Y (Variável dependente (explicada))
19,5 2850
18,5 2850
19,5 2900
17 2500
18,5 2500
19,5 3650
18,5 4200
18,5 10500
16,5 880
17,5 550
16 210
15,5 150
16,5 180
18 380
16 620
16,5 330
15,5 210
16 225
18,5 1300
17,5 465
18,5 780 Luís Costa, Universidade de Aveiro - ISCA
17 520
18,5 680
15 260
17 240
16,5 180
17 330
16,5 240
17,5 420
17 180
17 230
16,5 255
18 275
18 900
15 180
17,5 560
17,5 500
17 225
17,5 265
18 260
18 2500
17 380
17 310
18 980
17 380
17,5 450
16,5 250
18 360
15 325
18 520
15,5 280
18 350
14,5 1600
15 250
18 2400
17,5 450
17,5 520
17,5 1300
16,5 1620
18,5 800
18 500
17,5 350
18 840
16 550
17,5 1250
18 1500
17,5 10500
18 5000
16 300
15,5 700
18 1400 Luís Costa, Universidade de Aveiro - ISCA
17 1220
Procedimento referente à obtenção da representação gráfica e analítica da curva de regressão exponencial:
Clicar sobre um marcador no diagrama de dispersão -> Adicionar linha de tendência
-> Ativar opção "Exponencial" -> Ativar as opções "Mostrar equação no gráfico." e "Mostrar o valor de R 2
no gráfico." -> Fechar.

Ajustamento do modelo exponencial, Y(W)


12000

10000

8000

6000

4000

y = 0,1184e0,498x
2000
R² = 0,3026

0
0 5 10 15 20 25

Neste caso, R2=__0,3026__.

O modelo exponencial é preferível ao modelo linear, porquanto R 2(modelo exponencial) > R2(modelo linear).
____________________________________________________________________________________________

Exercício 3.2

(a)

(i) Identificação da variável explicativa e da variável explicada:

A variável explicativa consiste em X: temperatura média, pois esta é a variável independente.


A variável explicada consiste em Y: consumo de gás, dado que esta é a variável dependente (de X).

(ii) Obtenção do gráfico de dispersão:

Temperatura (ºC), X Consumo de gás (m3), Y

Diagrama de Dispersão, Y(X)


9 8,82
9 9,09
5 15,93
13 3,04
5 17,43
7 11,52
6 12,83
9 11,14
12 5,9 Luís Costa, Universidade de Aveiro - ISCA
10 6,42
Diagrama de Dispersão, Y(X)
20

15

10

0
0 2 4 6 8 10 12 14

(iii) Obtenção da representação analítica e gráfica da reta de regressão linear:

Ajustamento do modelo linear, Y(X)


20

15

10

5
y = -1,5712x + 23,568
R² = 0,9301
0
0 2 4 6 8 10 12 14

Assim, a equação definidora da reta de regressão linear que ajusta a amostra de dados consiste em .
yˆ = 23 , 568 − 1 , 5712 x .
(b)

O valor assumido pelo declive da reta de regressão linear consiste no coeficiente de regressão linear,
βˆ ≈ −1,5712 , pelo que aquele pode ser interpretado como sendo a diminuição prevista de consumo de
gás, 1.57 m 3, correspondente ao aumento da temperatura média em 1 oC.

(c)

Ajustamento do modelo exponencial, Y(X)


20

15

10
y = 42,396e-0,18x
5
R² = 0,9022
0
0 2 4 6 8 10 12 14 Luís Costa, Universidade de Aveiro - ISCA
O modelo exponencial que ajusta esta amostra de dados é definido pela equação yˆ = 42 , 396 e − 0 ,18 x .

(d)

O modelo de regressão linear, definido pela equação yˆ = 23 , 568 − 1 , 5712 x , oferece-nos um melhor
ajustamento aos dados, uma vez que o respetivo índice de correlação linear, R 2=0.93 , é superior ao
2
índice de correlação associado à curva de regressão exponencial obtida em (c), R =0.90 .
____________________________________________________________________________________________

Exercício 3.3

(a)

(i) Identificação da variável explicativa e da variável explicada:

A variável explicativa consiste em X: distância percorrida, expressa em quilómetros.


A variável explicada consiste em Y: tempo de entrega, expresso em minutos.

(ii) Obtenção do diagrama de dispersão:

Distância
Tempo de entrega
percorrida (Km),
(minutos), Y
X
Diagrama de Dispersão,
Y(X)
1,0 11
0,6 10
2,0 20
1,5 29
3,2 25
3,9 34
2,6 30
2,0 15
0,9 11
1,1 16

Diagrama de Dispersão, Y(X)


40
35
30
25
20
15
10
5
0
0,0 1,0 2,0 3,0 4,0 5,0
Luís Costa, Universidade de Aveiro - ISCA
(iii) Obtenção da representação analítica e gráfica da reta de regressão linear:

Ajustamento do modelo linear, Y(X)


40
y = 6,7378x + 7,4329
35
R² = 0,676
30
25
20
15
10
5
0
0,0 1,0 2,0 3,0 4,0 5,0

A equação definidora da reta de regressão linear que ajusta a amostra em estudo consiste em yˆ = 6 , 7378 x + 7 , 4329 .

(b)

O valor assumido pelo declive da reta de regressão linear consiste no coeficiente de regressão linear,
βˆ ≈ 6,74 , pelo que aquele é interpretável como sendo o aumento previsto do tempo de entrega,
6,74 minutos, correspondente ao aumento da distância percorrida em 1 km.

(c)

(i) Obtenção dos valores assumidos pelo coeficiente de regressão linear, índice de correlação linear,
utilizando o procedimento seguinte:

Dados - > Análise de Dados - > Regressão (OK) - > Intervalo Y (selecionar) - > Intervalo X (selecionar) - >
Ativar "Rótulos" - > Intervalo de saída - > OK.

Distância
Tempo de entrega
percorrida
(minutos), Y
(Km), X

1,0 11
0,6 10
2,0 20
1,5 29
3,2 25
3,9 34
2,6 30
2,0 15
0,9 11
1,1 16

Luís Costa, Universidade de Aveiro - ISCA


SUMÁRIO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,82217939
Quadrado de R 0,675978949
Quadrado de R ajustado
0,635476317
Erro-padrão 5,343248532
Observações 10

ANOVA
gl SQ MQ F F de significância
Regressão 1 476,4976 476,497561 16,689754 0,003508275
Residual 8 228,4024 28,55030488
Total 9 704,9

Coeficientes Erro-padrão Stat t valor P 95% inferior 95% superior Inferior 95,0%
Interceptar 7,432926829 3,531147 2,104961171 0,0684075 -0,70991221 15,57577 -0,70991
Distância percorrida
6,737804878
(Km), X 1,649276 4,085309518 0,0035083 2,934566511 10,54104 2,934567

Assim, tem-se:

Índice de correlação linear: R 2=0,68 .

Coeficiente de correlação linear: R=+0,82 . ( Este coeficiente é positivo, pois deve possuir
o mesmo sinal que coeficiente de regressão linear, que vale +6,737804878. )
(ii) Interpretações:

Índice de correlação linear: R 2=0,68 .

O valor assumido pelo índice de correlação linear interpreta-se como sendo a proporção da variação do tempo
de entrega que é justificada pela variação da distância percorrida, por meio do modelo linear.
Neste contexto, pode dizer-se que cerca de 68% da variação do tempo de entrega é justificada pela variação da
distância percorrida.

Coeficiente de correlação linear: R=+0,82 .

Dado que o valor assumido pelo coeficiente de correlação linear é relativamente próximo de +1, podemos
concluir que existe uma relação entre as duas variáveis consideravelmente próxima da relação linear perfeita
positiva.
Por outro lado, uma vez que este coeficiente é positivo, podemos deduzir que as duas variáveis, x e y, variam no
mesmo sentido.

(d)

Tempo de entrega associado a distância percorrida valendo 3 Km: ŷ ( 3 ) = 6 ,7378 * 3 + 7 ,4329 ≈ 27,65 (minutos)

Luís Costa, Universidade de Aveiro - ISCA


(e)

(i) Obtenção do diagrama de dispersão:

Distância
Tempo de entrega
percorrida
(minutos), Y
(Km), X
Diagrama de
Dispersão, Y(X) Diagrama de Dispersão, Y(X)
1,0 11 40
0,6 10
2,0 20 30
1,5 29
3,2 25 20
3,9 34
2,6 30 10
2,0 15
0,9 11 0
0,0 1,0 2,0 3,0 4,0 5,0
1,1 16

(ii) Obtenção da representação analítica e gráfica da curva de regressão do modelo "potência", com recurso
ao procedimento seguinte:

Clicar sobre um marcador - > Usando o botão direito, selecionar "Adicionar linha de tendência - >
Ativar "Potência" -> Ativar "Mostrar equação no gráfico" e "Mostrar o valor de R 2 no gráfico" - > Fechar.

Ajustamento do modelo "potência", Y(X)


40
35
30
25
y = 13,455x0,6515
20
R² = 0,7353
15
10
5
0
0,0 1,0 2,0 3,0 4,0 5,0

O modelo "potência" que ajusta esta amostra é definido pela equação yˆ = 13 , 455 x 0 , 6515 .

(f)

Dado que o índice de correlação associado à regressão curvilínea acabada de estudar, o qual vale 0,74, é
superior ao índice de correlação linear obtido em (c), que vale 0,68, deduz-se que o modelo de regressão
"potencia" é o que nos oferece um melhor ajustamento da amostra.
____________________________________________________________________________________________
Luís Costa, Universidade de Aveiro - ISCA
Exercício 3.4

Rendimento
Número médio de disponível
Ano espectadores por das famílias
sessão de Teatro (milhões de
Euros)

1960 407,7 384,9


1961 401,9 401,1
1962 396,2 439
1963 412,1 470
1964 410,8 508,9
1965 359 568,3
1966 356,6 622,5
1967 377,4 718
1968 395 782,9
1969 356,5 857,8
1979 299,4 5094,8
1980 231,9 6582,4
1981 242,2 8324,1
1982 202,8 10466
1983 155,6 12875,8
1984 150,5 15690,8
1985 166,7 18836,7
1986 162 22115,3
1987 160,3 26017,1
1988 151,4 29132,2
1989 114,6 34978,8
1990 144,6 41863,6
1991 134,1 49169,8
1992 121,3 54963,1
1993 78,6 57838,2
1994 131,9 60246,2
1995 96,5 64678,3
1996 111,5 67873,3
1997 88,7 71817,2
1998 98,4 76887,9
1999 136,9 83632,8
2000 128,3 89721,5
2001 134,7 94369,1
2002 150,4 98135,1
2003 140,2 101390,1
2004 151,9 105820,9
2005 147,9 109599,1
2006 142,2 112770,9
2007 146,7 118397,5
2008 145,7 124.784,70

Luís Costa, Universidade de Aveiro - ISCA


(a)

B C D E F

Rendimento
disponível
das famílias
(milhões de
Euros)

384,9 2982 Coluna1


401,1 2983
439 2984 Média 44495,67
470 2985 Erro-padrão 6624,764173
508,9 2986 Mediana 32055,50
568,3 2987 Moda #N/D
622,5 2988 Desvio-padrão
41898,68749 Desvio padrão corrigido
718 2989 Variância da amostra
1755500014 Variância corrigida
782,9 2990 Curtose -1,24405538
857,8 2991 Assimetria 0,48 Coeficiente de assimetria
5094,8 2992 Intervalo 124399,8
6582,4 2993 Mínimo 384,9
8324,1 2994 Máximo 124784,7
10466 2995 Soma 1779826,7
12875,8 2996 Contagem 40 Dimensão amostral
15690,8 2997
18836,7 2998 Variância amostral:
22115,3 2999 S 2 = (39/40)Sc2 = 1711612513 ( milhões de euros 2 )
26017,1 3000 Desvio padrão:
29132,2 3001 S= 41371,639 ( milhões de euros )
34978,8 3002
41863,6 3003 [ Determinação do terceiro quartil, usando a função "Percentil". ]
49169,8 3004
54963,1 Q0.75=
3005 78574,13 ( milhões de euros )
57838,2 3006
60246,2 3007 Editar =PERCENTIL($B$2982:$B$3021;0,75)
64678,3 3008
67873,3 3009 [ Determinação do coeficiente de variação. ]
71817,2 3010
76887,9 3011 Cv= 92,98 (%) Cv =
100 S
(% )
x
83632,8 3012
89721,5 3013 Editar =100*F3001/E2984
94369,1 3014
98135,1 3015
101390,1 3016
105820,9 3017
109599,1 3018
112770,9 3019
118397,5 3020
124.784,70 3021
Luís Costa, Universidade de Aveiro - ISCA
Face aos cálculos realizados anteriormente, obtemos as seguintes respostas às questões apresentadas:

(a.1)
O … foi em média de 44495,67 milhões de euros, para os anos considerados.

(A média dos rendimentos familiares disponíveis é a média amostral.)

(a.2)

No entanto, em metade … iguais a 32055,50 milhões de euros.

(A mediana vale, aproximadamente, 32055,50, pelo que 50% das observações assumem valor
inferior ou igual a 32055,50.)

(a.3)

Em 25% … foi superior a 78574,13 milhões de euros.

(O terceiro quartil vale, aproximadamente, 78574,13, pelo que 75% das observações assumem
valor inferior ou igual a 78574,13, donde decorre que (100-75)% = 25% das observações
assumem valor superior a 78574,13.)

(a.4)

O valor do coeficiente de assimetria é 0,48 , o que … mais baixos , … elevados.

(A moda é a medida de localização de mais baixo valor, pois a distribuição de frequências é


assimétrica positiva.)

(a.5)

O valor do coeficiente de variação é 93% , indicando que … uma grande variabilidade … média.

(b)

X Y
Diagrama de Dispersão, Y(X)
384,9 407,7
401,1 401,9
439 396,2
470 412,1
508,9 410,8
568,3 359
622,5 356,6
718 377,4
782,9 395
857,8 356,5
5094,8 299,4
6582,4 231,9 Luís Costa, Universidade de Aveiro - ISCA
8324,1 242,2
10466 202,8
12875,8 155,6
Diagrama de Dispersão, Y(X)
15690,8 150,5
450
18836,7 166,7
400
22115,3 162
350
26017,1 160,3
300
29132,2 151,4
250
34978,8 114,6
200
41863,6 144,6
150
49169,8 134,1
100
54963,1 121,3
50
57838,2 78,6
0
60246,2 131,9
0 20000 40000 60000 80000 100000 120000 140000
64678,3 96,5
67873,3 111,5
71817,2 88,7
76887,9 98,4
83632,8 136,9
89721,5 128,3
94369,1 134,7
98135,1 150,4
101390,1 140,2
105820,9 151,9
109599,1 147,9
112770,9 142,2
118397,5 146,7
124.784,70 145,7

(c)

Ajustamento do modelo linear, Y(X)


450
400
350
300
y = -0,0019x + 293,02
250
R² = 0,5023
200
150
100
50
0
0 20000 40000 60000 80000 100000 120000 140000

Ajuste … da reta ajustada é yˆ = 293 ,02 − 0,0019 x e o … é 0,50 .

Luís Costa, Universidade de Aveiro - ISCA


(d)

Ajustamento do modelo potência, Y(X)


450
400
350
300
250
y = 1573,1x-0,224
200 R² = 0,8686
150
100
50
0
0 20000 40000 60000 80000 100000 120000 140000

Ajuste … da curva ajustada é yˆ = 1573,1x −0, 224 e o … é 0,87 .

(e.1)

Falsa
(Face ao valor do índice de correlação linear, podemos deduzir que cerca de 50% da variação
do número médio de espectadores por sessão de teatro é explicada pela variação do rendimento
familiar disponível, por meio do modelo linear.)
(e.2)

Verdadeira
(Tendo em conta o valor do coeficiente de regressão linear, podemos concluir que, previsivelmente,
do número médio de espectadores por sessão de teatro diminui 0,0019 unidades, quando o
rendimento familiar disponível aumenta 1 milhão de euros.
Assim, previsivelmente, o número médio de espectadores por sessão de teatro diminui 19
unidades, quando o rendimento familiar médio sofre um aumento de 10000 milhões de euros.)

(e.3)

Falsa
(O modelo de regressão"potência", definido pela equação yˆ = 1573,1x −0,224 , oferece-nos um
2
melhor ajustamento, pois o respetivo índice de correlação, R potência=0.87 , é superior ao índice de
2
correlação linear, R linear=0.50.)

(e.4)

Verdadeira

(Tem-se ŷ (100000 ) = 1573 ,1 * 100000 − 0 , 224


≈ 119 (espectadores por sessão).)

____________________________________________________________________________________________

Luís Costa, Universidade de Aveiro - ISCA


Exercício 3.5

Período de Campistas (N.º) Hóspedes (N.º) nas Pousadas da


referência dos Juventude
dados
Dezembro de 2009 11616 10330
Novembro de 2009 31681 13421
Outubro de 2009 53181 16260
Setembro de 2009 123377 21003
Agosto de 2009 422217 32909
Julho de 2009 223767 25659
Junho de 2009 132553 25119
Maio de 2009 77609 20733
Abril de 2009 56856 23282
Março de 2009 39921 19316
Fevereiro de 2009 32230 14769
Janeiro de 2009 23638 9309
Dezembro de 2008 32119 15082
Novembro de 2008 38113 16326
Outubro de 2008 48403 15396
Setembro de 2008 120803 21976
Agosto de 2008 438323 28870
Julho de 2008 231540 24987
Junho de 2008 114571 21828
Maio de 2008 64450 21257
Abril de 2008 53120 19745
Março de 2008 46621 21887
Fevereiro de 2008 32490 14521
Janeiro de 2008 26055 10635
Campistas (N.º) por Local de residência; Mensal
Hóspedes (N.º) nas pousadas da juventude por Local de residência; Mensal

(a)

Número de
campistas
11616 Coluna1
31681
53181 Média 103136 (0 casas decimais)
123377 Erro-padrão 23752,43678
422217 Mediana 53151 (0 casas decimais)
223767 Moda #N/D
132553 Desvio-padrão 116362,7005 Desvio padrão corrigido
77609 13540278074
Variância da amostra Variância corrigida
56856 Curtose 3,892769687
39921 Assimetria 2,095335484 Coeficiente de assimetria
32230 Intervalo 426707 Amplitude amostral
23638 Mínimo 11616
32119 Máximo 438323
38113 Soma 2475254
48403 Contagem 24 Dimensão amostral
120803
438323 Variância amostral:
231540 S 2 = (23/24)Sc2 = 2
12976099820 ( campistas )
114571 Desvio padrão:
64450 S= 113912,685 ( campistas )
53120
46621
32490
26055 Luís Costa, Universidade de Aveiro - ISCA
[ Determinação do coeficiente de variação. ]

Cv= 110,45 (%) Cv =


100 S
(% )
x

Face aos cálculos efetuados anteriormente, obtemos as seguintes respostas às questões expostas:

(a.1)
O … foi 103136 , para os meses considerados.

(A média do número de campistas é a média amostral.)

(a.2)

No entanto, em metade … iguais a 53151 .

(A mediana vale, aproximadamente, 53151, pelo que 50% das observações assumem valor
inferior ou igual a 53151.)

(a.3)

O número de … de amplitude 426707 .

(A amplitude amostral vale 426707.)

(a.4)

O valor do coeficiente de variação é 110% .

(a.5)

Os valores … apresentam uma muito grande variabilidade em … no valor da variância, da


variância corrigida, do desvio padrão, do desvio padrão corrigido, e do coeficiente de variação .

(b)

X Y
Diagrama de Dispersão, Y(X)
Diagrama de Dispersão, Y(X)
11616 10330
31681 13421 35000
53181 16260 30000
123377 21003 25000
422217 32909
20000
223767 25659
15000
132553 25119
10000
77609 20733
56856 23282 5000
39921 19316 0
32230 14769 0 100000 200000 300000 400000 500000
23638 9309 Luís Costa, Universidade de Aveiro - ISCA
32119 15082
38113 16326
48403 15396
120803 21976
438323 28870
231540 24987
114571 21828
64450 21257
53120 19745
46621 21887
32490 14521
26055 10635

Ajustamento do modelo linear, Y(X)


40000
35000
y = 0,042x + 15026
30000
R² = 0,6762
25000
20000
15000
10000
5000
0
0 100000 200000 300000 400000 500000

Ajustamento do modelo logarítmico, Y(X)


35000
30000
25000
y = 5948,4ln(x) - 46647
20000
R² = 0,8517
15000
10000
5000
0
0 100000 200000 300000 400000 500000

(b.1)

Indique a equação da reta ajustada: yˆ = 15026 + 0 , 042 x , e o … índice de correlação: 0,68 .

(b.2)

Para efetuar … escolher o logarítmico , uma vez que a este modelo corresponde o maior índice
de correlação.
Luís Costa, Universidade de Aveiro - ISCA
(c.1)

Falsa
(Tendo em consideração o valor do índice de correlação linear, conclui-se que cerca de 68% da
variação do número de hóspedes em Pousadas da Juventude é explicada pela variação do número
de campistas, por meio do modelo linear.)
(c.2)

Verdadeira
(Face ao valor do coeficiente de regressão linear, podemos deduzir que, previsivelmente, do
número de hóspedes nas Pousadas da Juventude aumenta 0,042 unidades, quando o número de
campistas aumenta 1 unidade.
Assim, previsivelmente, o número de hóspedes nas Pousadas da Juventude aumenta 42
unidades, quando o número de campistas sofre um aumento de 1000 unidades.)

(c.3)

Verdadeira

(Tem-se ŷ (200000 ) = 5948 , 4 * ln (200000 ) − 46647 ≈ 25960 (hóspedes).)

____________________________________________________________________________________________

Luís Costa, Universidade de Aveiro - ISCA

Você também pode gostar