Escolar Documentos
Profissional Documentos
Cultura Documentos
Você acha que esta afirmação é justificada? Use um teste t de uma amostra para tirar sua
conclusão.
Sim, o saldo médio em seus cartões de crédito é de US$ 500. Portanto, a afirmação é
justificada. Conclui-se com base no teste t de uma amostra.
Explicação:
Hipótese nula: o saldo médio do cartão de crédito é de $ 500
Hipótese alternativa: o saldo médio do cartão de crédito não é de US$ 500
Equilíbrio
Significar 520.015
Variância 211378.2253
Observações 400
Média hipotética 500
df 399
tEstat. 0.870673781
P(T<=t) unicaudal 0.192227914
t Crítico unicaudal 1.648681534
P(T<=t) bicaudal 0.384455827
t Bicaudal crítico 1.965927296
Como o valor P de um teste de cauda é maior que nosso nível de significância 0,05, a
hipótese nula não pode ser rejeitada, ou seja, o saldo médio do cartão de crédito é de $
500.
2. Existe diferença entre homens e mulheres no que diz respeito ao equilíbrio médio? Use um
teste t de duas amostras para tirar sua conclusão.
Não há diferença significativa entre homens e mulheres no que diz respeito ao
equilíbrio médio.
Explicação:
Hipótese Nula: O saldo médio do cartão de crédito para homens e mulheres não tem
diferença.
Hipótese alternativa: O saldo médio do cartão de crédito para homens e mulheres é
diferente.
Men Women
Mean 509.8031088 529.5362
Variance 213554.5652 210187.1
Observations 193 207
Hypothesized Mean Difference 0
df 396
t Stat -0.42838443
P(T<=t) one-tail 0.334302083
t Critical one-tail 1.648710601
P(T<=t) two-tail 0.668604165
t Critical two-tail 1.965972608
3. Existe diferença entre estudantes e não estudantes no que diz respeito ao saldo médio? Use
um teste t de duas amostras para tirar sua conclusão.
Sim, existe uma diferença significativa entre Estudantes e Não Estudantes no que diz
respeito ao saldo médio.
Explicação:
Hipótese Nula: O saldo médio do cartão de crédito para Estudantes e Não Estudantes não
tem diferença.
Hipótese alternativa: O saldo médio do cartão de crédito para estudantes e não estudantes é
diferente.
Como o valor P do teste bicaudal é menor que nosso nível de significância 0,05, a hipótese
nula pode ser rejeitada, ou seja, o saldo médio do cartão de crédito é diferente para estudantes
e não estudantes.
4. Geralmente presume-se que se houver mais cartões de crédito, o saldo dos cartões será
maior. Com base neste conjunto de dados, você acha que isso é verdade? Calcule um
coeficiente de correlação e mostre um gráfico de dispersão para apoiar sua resposta.
Não, isto não é verdade. Não há correlação entre eles. O coeficiente de correlação é
muito menor .
Coeficiente de correlação:
Cards Balance
Cards 1
Balance 0.086456 1
O coeficiente de correlação é quase igual a zero, o que implica que não existe relação entre o
número de cartões e o saldo dos cartões.
Gráfico de dispersão:
Os valores caem dispersos e não seguindo a linha de tendência, a correlação é muito menor.
O coeficiente de correlação é quase igual a zero, o que implica que não há relação entre
idade e escolaridade no saldo credor.
Gráfico de dispersão:
É claro que a tendência não apresenta correlação, portanto o saldo de crédito não
depende dessas variáveis.
5c.
Hipótese Nula: O saldo médio do cartão de crédito para Solteiros e Casados é igual.
Hipótese alternativa: O saldo médio do cartão de crédito para solteiros e casados é
diferente.
Single Married
Mean 523.2903226 517.9429
Variance 221735.0385 205696.7
Observations 155 245
Hypothesized Mean Difference
0
df 319
t Stat 0.112233601
P(T<=t) one-tail0.455354389
t Critical one-tail
1.649644319
P(T<=t) two-tail0.910708777
t Critical two-tail
1.967428387
O valor de P é maior, portanto a hipótese nula, portanto não pode ser rejeitada, o que
significa que não há alterações significativas causadas pelo estado civil
6 . A etnia do titular do cartão não importa no que diz respeito ao equilíbrio.” Realize uma
análise de variância (ANOVA) e discuta se esta afirmação é apoiada pelos dados ou não
Hipótese Nula: A etnia do titular do cartão não importa tanto quanto o equilíbrio, ou seja, o
mesmo
Hipótese alternativa: a etnia do titular do cartão é importante no que diz respeito ao
equilíbrio
Com base na ANOVA fica claro que o valor P é superior a 0,05. Portanto, a Etnia não tem
impacto no equilíbrio.
SUMMARY
Groups Count Sum Average Variance
African American 99 52569 531 235839.2
Asian 102 52256 512.3137 231748.3
Caucasian 199 103181 518.4975 190922.4
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 18454.20047 2 9227.1 0.043443 0.957492 3.018452
Within Groups 84321457.71 397 212396.6
Coeficiente de correlação:
Limit Rating
Limit 1
Rating 0.99688 1
8. Execute uma regressão linear simples do saldo do limite de crédito. (Aqui o limite de
crédito é o X e o saldo é o Y). Relate os coeficientes e o R ao quadrado. Mostre um gráfico
de dispersão.
Regression Statistics
Multiple R 0.861697
R Square 0.742522
Adjusted R Square 0.741875
Standard Error 233.585
Observations 400
ANOVA
df SS MS F Significance F
Regression 1 62624255 62624255 1147.764 2.5E-119
Residual 398 21715657 54561.95
Total 399 84339912
Coefficients
Standard Error t Stat P-value Lower 95%Upper 95%Lower 95.0%
Upper 95.0%
Intercept -292.79 26.68341 -10.9728 1.18E-24 -345.249 -240.332 -345.249 -240.332
Credit Limit 0.171637 0.005066 33.87867 2.5E-119 0.161677 0.181597 0.161677 0.181597
Gráfico de dispersão:
Regression Statistics
Multiple R 0.863625161
R Square 0.745848418
Adjusted R Square 0.745209846
Standard Error 232.0713048
Observations 400
ANOVA
df SS MS F Significance F
Regression 1 62904789.88 62904790 1167.994581 1.8989E-120
Residual 398 21435122.03 53857.09
Total 399 84339911.91
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0%Upper 95.0%
Intercept -390.8463418 29.06851463 -13.4457 3.07318E-34 -447.993365 -333.6993186 -447.993365 -333.699
Credit Rating(X) 2.566240327 0.075089102 34.17594 1.8989E-120 2.418619483 2.713861171 2.418619483 2.713861
Gráfico de dispersão:
Sim, a classificação de crédito influencia o saldo de crédito. Tem uma correlação decente.
10. Considere suas conclusões nas questões 8 a 9. Discuta mecanismos comerciais para
aumentar ou diminuir o saldo dos cartões de crédito. Tente quantificar suas respostas.
É claro que a classificação e o limite de crédito do cartão de crédito têm um impacto
significativo no saldo do cartão de crédito. Ambos têm boa correlação. Ambos são
preditores significativos do saldo do cartão de crédito. O saldo é alto para quem tem
classificação de crédito e limite de crédito altos. Tanto a classificação quanto o limite
são preditores significativos de equilíbrio.
O saldo das pessoas com classificação mais alta e com limite de crédito mais alto
pode ser aumentado, enquanto o saldo das pessoas com classificação mais baixa e
com limite de crédito mais baixo deve ser diminuído. (com base nesta análise)
11. O limite de crédito é fornecido como um valor consolidado para todos os cartões de
crédito que o titular do cartão possui. Execute uma regressão linear múltipla de Saldo (Y) no
Limite e Cartões como duas variáveis X. Informe os coeficientes. Discuta o efeito sobre o
saldo de (a) aumentar o limite de crédito no mesmo número de cartões e (b) aumentar o
número de cartões sem alterar o limite de crédito total.
Regressão linear múltipla:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.865188295
R Square 0.748550786
Adjusted R Square 0.74728404
Standard Error 231.1247525
Observations 400
ANOVA
df SS MS F Significance F
Regression 2 63132707.37 31566354 590.9238 9.8E-120
Residual 397 21207204.54 53418.65
Total 399 84339911.91
2000
SUMMARY OUTPUT
1500
Regression Statistics
Multiple R 0.463656457
1000
R Square 0.21497731
Adjusted R Square 0.213004891
500
Standard Error 407.8647195
Observations 400
0
0 50 100 150 200
ANOVA
df SS MS F Significance F
Regression 1 18131167.4 18131167 108.9917152 1.03089E-22
Residual 398 66208744.51 166353.6
Total 399 84339911.91
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 246.5147506 33.19934735 7.425289 6.90344E-13 181.2467485 311.7827527 181.2467485 311.7827527
Income 6.048363409 0.579350163 10.43991 1.03089E-22 4.909394402 7.187332415 4.909394402 7.187332415
Renda Saldo(s)
Renda 1
Saldo(s) 0.46365645 1
7
13. Com base na equação derivada da questão 12, qual é o saldo estimado para uma pessoa
com um rendimento de 100 mil dólares por ano?
Balance(y)
2500
2000
1500
f(x) = 6.04836340853157 x + 246.514750591403
R² = 0.214977310132406
1000
500
0
0 20 40 60 80 100 120 140 160 180 200
14. Com base no conjunto de dados, explore a relação entre o saldo do cartão de crédito (Y) e
(a) Renda (b) Idade (c) Educação (c) Limite e (d) Classificação como variáveis X? Estime um
modelo de regressão linear múltipla e relate a significância estatística de cada uma dessas
variáveis.
Regression Statistics
Multiple R 0.936702578
R Square 0.87741172
Adjusted R Square
0.875856031
Standard Error
161.9917647
Observations 400
ANOVA
df SS MS F Significance F
Regression 5 74000827.17 14800165.43 564.0020686 4.5908E-177
Residual 394 10339084.74 26241.33183
Total 399 84339911.91
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Lower 95.0%
Upper 95.0%
Intercept -473.2514026 55.10833546 -8.587655545 2.08837E-16 -581.5945666 -364.908 -581.595 -364.908
Income -7.608832003 0.381931562 -19.92197755 1.37077E-61 -8.359710677 -6.85795 -8.35971 -6.85795
Limit 0.07901642 0.044791005 1.764113581 0.078487737 -0.009042839 0.167076 -0.00904 0.167076
Rating 2.773843725 0.667079559 4.158190261 3.93909E-05 1.462363177 4.085324 1.462363 4.085324
Age -0.860030445 0.478700493 -1.796594023 0.073165937 -1.801157147 0.081096 -1.80116 0.081096
Education 1.967791521 2.605290902 0.755305874 0.450516748 -3.154218733 7.089802 -3.15422 7.089802
Regression Statistics
Multiple R 0.93547739
R Square 0.875117948
Adjusted R Square 0.874488819
Standard Error 162.8813393
Observations 400
ANOVA
df SS MS F Significance F
Regression 2 73807370.62 36903685.31 1390.999823 4.5212E-180
Residual 397 10532541.29 26530.33071
Total 399 84339911.91
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -534.8121502 21.60269845 -24.75672896 1.66359E-82 -577.2821357 -492.3421648 -577.282136 -492.3421648
Income -7.672124366 0.378462026 -20.2718472 3.1071E-63 -8.416164597 -6.928084134 -8.4161646 -6.928084134
Rating 3.949264832 0.086209035 45.81033566 1.4482E-160 3.77978154 4.118748125 3.77978154 4.118748125
Explicação:
Com base na análise de regressão múltipla, fica claro que a renda e a classificação são
os dois preditores estatisticamente significativos com base no valor p.
Todas essas variáveis, ou seja, renda, escolaridade, idade, limite e classificação, juntas
contribuíram para 87,7% da variação do saldo do cartão de crédito.
Mas para compreender se estas variáveis também contribuíram e se apenas algumas
contribuíram para a variação no equilíbrio, são mantidas análises com valores P
aceitáveis.
Portanto, mantendo os Xs com valor p baixo, ou seja, apenas com renda e
classificação , a análise de regressão foi feita novamente.
Nesta regressão, a análise com essas duas variáveis mostrou variação de 87,5% no
saldo do cartão de crédito.
Que é quase o mesmo valor de r quadrado do anterior.
Com base nisso, fica muito claro que Renda e classificação são os dois preditores
significativos .
Também se estuda os erros (resíduos) e o padrão.
Ao focar nos resíduos de rendimento, verifica-se que há mais valores no lado negativo
e, especificamente, mais grupos de rendimentos mais baixos e a linha de ajuste
também não é linear.
Os resíduos de classificação mostraram um lado positivo para classificações inferiores
e superiores, onde mostraram classificações negativas para outras classificações
típicas, onde a linha de ajuste das classificações é decente.
Observações Finais,
A renda e a classificação são as duas variáveis importantes que contribuem
para a mudança no equilíbrio, enquanto o limite, a idade e a escolaridade não
são variáveis significativas para o equilíbrio.