Escolar Documentos
Profissional Documentos
Cultura Documentos
1) Suponha que você queira prever os ganhos (US$) usando somente o número de pole positions (“Poles”), ou o número de vitórias (“Vitóras”), ou o número de cor
dez primeiros (“Top 10”). Qual dessas quatro variáveis fornece o melhor previsor único de ganhos?
2) Desenvolva uma equação de regressão estimada que possa ser usada para prever os ganhos considerando o número de pole positions (“Poles”), o número de vitór
número de corridas entre os dez primeiros (“Top 10”). Teste a significância individual, interprete os coeficientes e discuta suas descobertas e conclusões.
3) Crie duas novas variáveis independentes: “Top 2-5” e “Top 6-10”. “Top 2-5” representa o número de vezes que o piloto chegou entre a segunda e a quinta posiçã
décima colocação. Desenvolva uma equação de regressão estimada que possa ser usada para prever os ganhos considerando o número de pole positions (“Poles”), o n
Teste a significância individual, interprete os coeficientes e discuta suas descobertas e conclusões.
4) Com base nos resultados da sua análise, qual equação de regressão estimada você recomendaria para prever os ganhos (US$)?
Estatística de regressão
R múltiplo 0.9058081593
R-Quadrado 0.8204884215
R-quadrado ajustado 0.7965535444
Erro padrão 581382.19679
Observações 35
ANOVA
gl SQ MQ F F de significação
Regressão 4 4.634733E+13 11586832038700.5 34.280034818 8.619415056E-11
Resíduo 30 1.014016E+13 338005258749.844
Total 34 5.648749E+13
Com base nos valores-P encontrados para cada coeficiente, a regressão usando os valores de top5 e top10 parece mais precisa do que a
regressão usando top 2-5 e top 6-10. Mesmo tendo uma interpretação mais difícil, ela parece encontrar resultados menos dispersos que a
outra regressão. Nota-se por fim que a estatística de regressão e a análise de variância sçao iguais para ambas.
já que na temporada de 2011 ele terminou em quarto lucar, com 2.330 pontos, atrás de Tony Stewart
sitions (piloto mais rápido na qualificação), vencer três corridas, terminar entre os cinco primeiros 12
que chegasse em segundo, e assim por diante até chegar a 1 ponto para o piloto em 43º lugar. Além
s um ponto de bônus e o vencedor da corrida era premiado com três pontos de bônus. Porém, o
orada de 2011 (site da NASCAR, 28 de fevereiro de 2011.
as”), ou o número de corridas entre os cinco primeiros (“Top 5”), ou o número de corridas entre os
les”), o número de vitórias (“Vitóras”), o número de corridas entre os cinco primeiros (“Top 5”), e o
conclusões.
egunda e a quinta posição. “Top 6-10” é o número de vezes que o piloto chegou entre a sexta e a
positions (“Poles”), o número de vitórias (“Vitóras”), e as variáveis criadas “Top 2-5” e “Top 6-10”.
Inferior 95.0% Superior 95.0%
2764121.22497 3516612.948875
-231880.892947 206003.0513431
-213609.425277 240699.0506522
-31846.1550857 175104.9416446
48791.5190737 185349.6345752
SQ MQ F F de significação
4.6347328E+13 11586832038701 34.280034818 8.619415056E-11
1.0140158E+13 338005258750
5.6487486E+13
ariáveis novas diminuiu em relação às variáveis anteriores Top5 e Top10. Portanto, pode-se inferir que é mais
ção do ganho de um piloto o número de vezes que ele esteve no top 5 ou top 10 juntamente com o número de
es dados sejam redundantes (já que uma vitória a mais acarreta uma participação a mais no top 5 e uma no top
esta abordagem é mais facilmente interpretada, já que agora cada variável "X" é independente das demais.