Você está na página 1de 11

Piloto Pontos Poles Vitórias Top 5 Top 10 Ganho (US$)

Tony Stewart 2,403 1 5 9 19 6,529,870


Carl Edwards 2,403 3 1 19 26 8,485,990
Kevin Harvick 2,345 0 4 9 19 6,197,140
Matt Kenseth 2,330 3 3 12 20 6,183,580
Brad Keselowski 2,319 1 3 10 14 5,087,740 Matt Kenseth venceu a Deytona 500 de 2012, a corrid
Jimmie Johnson 2,304 0 2 14 21 6,296,360 (2.403 pontos), Carl Edward (2.403 pontos) e Kevein
Dale Earnhardt Jr. 2,290 1 0 4 12 4,163,690 vezes e entre os dez primeiros 20 vezes. O sistema de
disso, qualquer motorista que liderasse uma volta rece
Jeff Gordon 2,287 1 3 13 18 5,912,830
número máximo de pontos que o piloto poderia recebe
Denny Hamlin 2,284 0 1 5 14 5,401,190
Ryan Newman 2,284 3 1 9 17 5,303,020 1) Suponha que você queira prever os ganhos (US$)
Kurt Busch 2,262 3 2 8 16 5,936,470 dez primeiros (“Top 10”). Qual dessas quatro variávei
Kyle Busch 2,246 1 4 14 18 6,161,020 2) Desenvolva uma equação de regressão estimada q
Clint Bowyer 1,047 0 1 4 16 5,633,950 número de corridas entre os dez primeiros (“Top 10”)
3) Crie duas novas variáveis independentes: “Top 2-
Kasey Kahne 1,041 2 1 8 15 4,775,160 décima colocação. Desenvolva uma equação de regres
A.J. Allmendinger 1,013 0 0 1 10 4,825,560 Teste a significância individual, interprete os coeficien
Greg Biffle 997 3 0 3 10 4,318,050 4) Com base nos resultados da sua análise, qual equa
Paul Menard 947 0 1 4 8 3,853,690
Martin Truex Jr. 937 1 0 3 12 3,955,560
Marcos Ambrose 936 0 1 5 12 4,750,390
Jeff Burton 935 0 0 2 5 3,807,780
Juan Montoya 932 2 0 2 8 5,020,780
Mark Martin 930 2 0 2 10 3,830,910
David Ragan 906 2 1 4 8 4,203,660 1)
Joey Logano 902 2 0 4 6 3,856,010
Brian Vickers 846 0 0 3 7 4,301,880
Regan Smith 820 0 1 2 5 4,579,860
Jamie McMurray 795 1 0 2 4 4,794,770
David Reutimann 757 1 0 1 3 4,374,770
Bobby Labonte 670 0 0 1 2 4,505,650
David Gilliland 572 0 0 1 2 3,878,390
Casey Mears 541 0 0 0 0 2,838,320
Dave Blaney 508 0 0 1 1 3,229,210
Andy Lally* 398 0 0 0 0 2,868,220
Robby Gordon 268 0 0 0 0 2,271,890
J.J. Yeley 192 0 0 0 0 2,559,500 2)
3)
4)
Matt Kenseth venceu a Deytona 500 de 2012, a corrida mais importante da temporada da NASCAR. A vitória dele não foi nenhuma surpresa, já que na temporada de
(2.403 pontos), Carl Edward (2.403 pontos) e Kevein Harvick (2.345 pontos). Em 2011, ele ganhou US$ 6.183.580 ao conseguir três pole positions (piloto mais rápid
vezes e entre os dez primeiros 20 vezes. O sistema de pontos de 2011 da NASCAR dava 43 pontos ao piloto que chegasse em primeiro, 42 ao que chegasse em segun
disso, qualquer motorista que liderasse uma volta recebia um ponto de bônus, o motorista que liderasse o maior número de voltas recebia mais um ponto de bônus e o
número máximo de pontos que o piloto poderia receber em uma corrida era 48. Os dados mostram os dados dos 35 principais pilotos na temporada de 2011 (site da N

1) Suponha que você queira prever os ganhos (US$) usando somente o número de pole positions (“Poles”), ou o número de vitórias (“Vitóras”), ou o número de cor
dez primeiros (“Top 10”). Qual dessas quatro variáveis fornece o melhor previsor único de ganhos?
2) Desenvolva uma equação de regressão estimada que possa ser usada para prever os ganhos considerando o número de pole positions (“Poles”), o número de vitór
número de corridas entre os dez primeiros (“Top 10”). Teste a significância individual, interprete os coeficientes e discuta suas descobertas e conclusões.
3) Crie duas novas variáveis independentes: “Top 2-5” e “Top 6-10”. “Top 2-5” representa o número de vezes que o piloto chegou entre a segunda e a quinta posiçã
décima colocação. Desenvolva uma equação de regressão estimada que possa ser usada para prever os ganhos considerando o número de pole positions (“Poles”), o n
Teste a significância individual, interprete os coeficientes e discuta suas descobertas e conclusões.
4) Com base nos resultados da sua análise, qual equação de regressão estimada você recomendaria para prever os ganhos (US$)?

Covariâncias com ganho:


média pontos 1,304
média poles 0.94 poles 580964.13445
média Vitórias 1.00 vitórias 1188063.2353
médis Top5 5.11 top5 5396217.6134
média top10 10 top10 8268976.6975
média ganho 4,705,510
De todas as variáveis, aquela que tem uma maior covariância com o ganho é o número de Top10, assim,
pode ser que forneça a melhor estimativa para o ganho individual.

RESUMO DOS RESULTADOS

Estatística de regressão
R múltiplo 0.9058081593
R-Quadrado 0.8204884215
R-quadrado ajustado 0.7965535444
Erro padrão 581382.19679
Observações 35

ANOVA
gl SQ MQ F F de significação
Regressão 4 4.634733E+13 11586832038700.5 34.280034818 8.619415056E-11
Resíduo 30 1.014016E+13 338005258749.844
Total 34 5.648749E+13

Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores


Interseção 3140367.0869 184229.02429 17.0459953259994 5.594539E-17 2764121.2249667 3516612.948875
Poles -12938.920802 107205.07515 -0.120693174128146 0.9047388016 -231880.89294699 206003.0513431
Vitórias 13544.812687 111226.2163 0.121777159542224 0.9038875698 -213609.42527728 240699.0506522
Top5 71629.393279 50666.867707 1.41373241570037 0.1677341625 -31846.155085705 175104.9416446
Top10 117070.57682 33432.883815 3.50165954786181 0.0014703143 48791.519073721 185349.6345752
poles vitorias top 2-5 top 6-10
1 5 4 10 RESUMO DOS RESULTADOS
3 1 18 7
0 4 5 10 Estatística de regressão
3 3 9 8 R múltiplo 0.905808159325
1 3 7 4 R-Quadrado 0.8204884215
0 2 12 7 R-quadrado ajustad 0.796553544367
1 0 4 8 Erro padrão 581382.1967947
1 3 10 5 Observações 35
0 1 4 9
3 1 8 8 ANOVA
3 2 6 8 gl
1 4 10 4 Regressão 4
0 1 3 12 Resíduo 30
2 1 7 7 Total 34
0 0 1 9
3 0 3 7 Coeficientes
0 1 3 4 Interseção 3140367.086921
1 0 3 9 poles -12938.9208019
0 1 4 7 vitorias 202244.7827914
0 0 2 3 top 2-5 188699.9701039
2 0 2 6 top 6-10 117070.5768245
2 0 2 8
2 1 3 4 O valor P de ambas as variáveis novas diminuiu
2 0 4 2 valioso para a determinação do ganho de um pil
0 0 3 4 vitórias, mesmo que estes dados sejam redundan
0 1 1 3 10). Por outro lado, esta abordagem é mais f
1 0 2 2
1 0 1 2
0 0 1 1
0 0 1 1
0 0 0 0
0 0 1 0
0 0 0 0
0 0 0 0
0 0 0 0

Com base nos valores-P encontrados para cada coeficiente, a regressão usando os valores de top5 e top10 parece mais precisa do que a
regressão usando top 2-5 e top 6-10. Mesmo tendo uma interpretação mais difícil, ela parece encontrar resultados menos dispersos que a
outra regressão. Nota-se por fim que a estatística de regressão e a análise de variância sçao iguais para ambas.
já que na temporada de 2011 ele terminou em quarto lucar, com 2.330 pontos, atrás de Tony Stewart
sitions (piloto mais rápido na qualificação), vencer três corridas, terminar entre os cinco primeiros 12
que chegasse em segundo, e assim por diante até chegar a 1 ponto para o piloto em 43º lugar. Além
s um ponto de bônus e o vencedor da corrida era premiado com três pontos de bônus. Porém, o
orada de 2011 (site da NASCAR, 28 de fevereiro de 2011.

as”), ou o número de corridas entre os cinco primeiros (“Top 5”), ou o número de corridas entre os

les”), o número de vitórias (“Vitóras”), o número de corridas entre os cinco primeiros (“Top 5”), e o
conclusões.
egunda e a quinta posição. “Top 6-10” é o número de vezes que o piloto chegou entre a sexta e a
positions (“Poles”), o número de vitórias (“Vitóras”), e as variáveis criadas “Top 2-5” e “Top 6-10”.
Inferior 95.0% Superior 95.0%
2764121.22497 3516612.948875
-231880.892947 206003.0513431
-213609.425277 240699.0506522
-31846.1550857 175104.9416446
48791.5190737 185349.6345752
SQ MQ F F de significação
4.6347328E+13 11586832038701 34.280034818 8.619415056E-11
1.0140158E+13 338005258750
5.6487486E+13

Erro padrão Stat t valor-P 95% inferiores95% superiores


Inferior 95.0%
Superior 95.0%
184229.024288 17.045995326 5.594539E-17 2764121.2249667 3516613 2764121 3516613
107205.075145 -0.12069317413 0.9047388016 -231880.89294699 206003.1 -231881 206003.1
90225.8683391 2.241538779448 0.0325415348 17978.977036633 386510.6 17978.98 386510.6
34586.3222563 5.455913141207 6.430281E-06 118065.27679521 259334.7 118065.3 259334.7
33432.8838153 3.501659547862 0.0014703143 48791.519073721 185349.6 48791.52 185349.6

ariáveis novas diminuiu em relação às variáveis anteriores Top5 e Top10. Portanto, pode-se inferir que é mais
ção do ganho de um piloto o número de vezes que ele esteve no top 5 ou top 10 juntamente com o número de
es dados sejam redundantes (já que uma vitória a mais acarreta uma participação a mais no top 5 e uma no top
esta abordagem é mais facilmente interpretada, já que agora cada variável "X" é independente das demais.

Você também pode gostar