Você está na página 1de 15

1. O gerente de uma empresa diz que o saldo médio em seus cartões de crédito é de US$ 500.

Você acha que esta afirmação é justificada? Use um teste t de uma amostra para tirar sua
conclusão.

Sim, o saldo médio em seus cartões de crédito é de US$ 500. Portanto, a afirmação é
justificada. Conclui-se com base no teste t de uma amostra.

Explicação:
Hipótese nula: o saldo médio do cartão de crédito é de $ 500
Hipótese alternativa: o saldo médio do cartão de crédito não é de US$ 500

Teste t: duas amostras assumindo variações


desiguais

Equilíbrio
Significar 520.015
Variância 211378.2253
Observações 400
Média hipotética 500
df 399
tEstat. 0.870673781
P(T<=t) unicaudal 0.192227914
t Crítico unicaudal 1.648681534
P(T<=t) bicaudal 0.384455827
t Bicaudal crítico 1.965927296

Como o valor P de um teste de cauda é maior que nosso nível de significância 0,05, a
hipótese nula não pode ser rejeitada, ou seja, o saldo médio do cartão de crédito é de $
500.

2. Existe diferença entre homens e mulheres no que diz respeito ao equilíbrio médio? Use um
teste t de duas amostras para tirar sua conclusão.
Não há diferença significativa entre homens e mulheres no que diz respeito ao
equilíbrio médio.
Explicação:
Hipótese Nula: O saldo médio do cartão de crédito para homens e mulheres não tem
diferença.
Hipótese alternativa: O saldo médio do cartão de crédito para homens e mulheres é
diferente.

t-Test: Two-Sample Assuming Unequal Variances

Men Women
Mean 509.8031088 529.5362
Variance 213554.5652 210187.1
Observations 193 207
Hypothesized Mean Difference 0
df 396
t Stat -0.42838443
P(T<=t) one-tail 0.334302083
t Critical one-tail 1.648710601
P(T<=t) two-tail 0.668604165
t Critical two-tail 1.965972608

Não é possível rejeitar a hipótese nula que µ1 é igual a µ2


Portanto, o saldo médio de homens e mulheres não apresenta diferenças significativas,
ou seja, é igual.

3. Existe diferença entre estudantes e não estudantes no que diz respeito ao saldo médio? Use
um teste t de duas amostras para tirar sua conclusão.

Sim, existe uma diferença significativa entre Estudantes e Não Estudantes no que diz
respeito ao saldo médio.
Explicação:
Hipótese Nula: O saldo médio do cartão de crédito para Estudantes e Não Estudantes não
tem diferença.
Hipótese alternativa: O saldo médio do cartão de crédito para estudantes e não estudantes é
diferente.
Como o valor P do teste bicaudal é menor que nosso nível de significância 0,05, a hipótese
nula pode ser rejeitada, ou seja, o saldo médio do cartão de crédito é diferente para estudantes
e não estudantes.

4. Geralmente presume-se que se houver mais cartões de crédito, o saldo dos cartões será
maior. Com base neste conjunto de dados, você acha que isso é verdade? Calcule um
coeficiente de correlação e mostre um gráfico de dispersão para apoiar sua resposta.
Não, isto não é verdade. Não há correlação entre eles. O coeficiente de correlação é
muito menor .

Coeficiente de correlação:
Cards Balance
Cards 1
Balance 0.086456 1

O coeficiente de correlação é quase igual a zero, o que implica que não existe relação entre o
número de cartões e o saldo dos cartões.
Gráfico de dispersão:
Os valores caem dispersos e não seguindo a linha de tendência, a correlação é muito menor.

5. Examinar se as seguintes variáveis demográficas influenciam o equilíbrio: (a) idade, (b)


anos de escolaridade, (c) estado civil. Para idade e anos de escolaridade, utilize gráficos de
dispersão para representar a sua relação com o equilíbrio e calcular o coeficiente de
correlação. Para a relação entre estado civil e equilíbrio, use um teste t de duas amostras para
tirar sua conclusão
As variáveis demográficas idade, anos de escolaridade, estado marcial não têm
influência no saldo de crédito.
5a e 5b
Coeficiente de correlação:
Age Education Balance
Age 1
Education 0.003619 1
Balance 0.001835 -0.00806 1

O coeficiente de correlação é quase igual a zero, o que implica que não há relação entre
idade e escolaridade no saldo credor.

Gráfico de dispersão:
É claro que a tendência não apresenta correlação, portanto o saldo de crédito não
depende dessas variáveis.

5c.
Hipótese Nula: O saldo médio do cartão de crédito para Solteiros e Casados é igual.
Hipótese alternativa: O saldo médio do cartão de crédito para solteiros e casados é
diferente.

t-Test: Two-Sample Assuming Unequal Variances

Single Married
Mean 523.2903226 517.9429
Variance 221735.0385 205696.7
Observations 155 245
Hypothesized Mean Difference
0
df 319
t Stat 0.112233601
P(T<=t) one-tail0.455354389
t Critical one-tail
1.649644319
P(T<=t) two-tail0.910708777
t Critical two-tail
1.967428387

O valor de P é maior, portanto a hipótese nula, portanto não pode ser rejeitada, o que
significa que não há alterações significativas causadas pelo estado civil
6 . A etnia do titular do cartão não importa no que diz respeito ao equilíbrio.” Realize uma
análise de variância (ANOVA) e discuta se esta afirmação é apoiada pelos dados ou não
Hipótese Nula: A etnia do titular do cartão não importa tanto quanto o equilíbrio, ou seja, o
mesmo
Hipótese alternativa: a etnia do titular do cartão é importante no que diz respeito ao
equilíbrio

Com base na ANOVA fica claro que o valor P é superior a 0,05. Portanto, a Etnia não tem
impacto no equilíbrio.

Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
African American 99 52569 531 235839.2
Asian 102 52256 512.3137 231748.3
Caucasian 199 103181 518.4975 190922.4

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 18454.20047 2 9227.1 0.043443 0.957492 3.018452
Within Groups 84321457.71 397 212396.6

Total 84339911.91 399

7. Um princípio geral frequentemente seguido pelas empresas de cartão de crédito é atribuir


um limite de crédito mais elevado a pessoas com uma classificação de crédito mais elevada.
Os dados mostram que este princípio está sendo seguido?
Sim, este princípio é seguido.

Coeficiente de correlação:
Limit Rating
Limit 1
Rating 0.99688 1

Tem um bom acordo.


Gráfico de dispersão:

As empresas de cartão de crédito costumam seguir atribuir um limite de crédito mais


alto a pessoas com uma classificação de crédito mais alta, o que é verdade no nosso caso.
Justifica-se com base na correlação.

8. Execute uma regressão linear simples do saldo do limite de crédito. (Aqui o limite de
crédito é o X e o saldo é o Y). Relate os coeficientes e o R ao quadrado. Mostre um gráfico
de dispersão.

Regressão linear simples:


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.861697
R Square 0.742522
Adjusted R Square 0.741875
Standard Error 233.585
Observations 400

ANOVA
df SS MS F Significance F
Regression 1 62624255 62624255 1147.764 2.5E-119
Residual 398 21715657 54561.95
Total 399 84339912

Coefficients
Standard Error t Stat P-value Lower 95%Upper 95%Lower 95.0%
Upper 95.0%
Intercept -292.79 26.68341 -10.9728 1.18E-24 -345.249 -240.332 -345.249 -240.332
Credit Limit 0.171637 0.005066 33.87867 2.5E-119 0.161677 0.181597 0.161677 0.181597

Gráfico de dispersão:

O limite de crédito é um preditor significativo. Tem uma correlação decente, ou seja, R 2 =


0,74
9. Execute uma regressão linear simples do saldo (Y) na classificação de crédito (X). Relate
os coeficientes e R ao quadrado. Mostrar um gráfico de dispersão
Regressão linear simples:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.863625161
R Square 0.745848418
Adjusted R Square 0.745209846
Standard Error 232.0713048
Observations 400

ANOVA
df SS MS F Significance F
Regression 1 62904789.88 62904790 1167.994581 1.8989E-120
Residual 398 21435122.03 53857.09
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0%Upper 95.0%
Intercept -390.8463418 29.06851463 -13.4457 3.07318E-34 -447.993365 -333.6993186 -447.993365 -333.699
Credit Rating(X) 2.566240327 0.075089102 34.17594 1.8989E-120 2.418619483 2.713861171 2.418619483 2.713861

Gráfico de dispersão:

Sim, a classificação de crédito influencia o saldo de crédito. Tem uma correlação decente.

10. Considere suas conclusões nas questões 8 a 9. Discuta mecanismos comerciais para
aumentar ou diminuir o saldo dos cartões de crédito. Tente quantificar suas respostas.
 É claro que a classificação e o limite de crédito do cartão de crédito têm um impacto
significativo no saldo do cartão de crédito. Ambos têm boa correlação. Ambos são
preditores significativos do saldo do cartão de crédito. O saldo é alto para quem tem
classificação de crédito e limite de crédito altos. Tanto a classificação quanto o limite
são preditores significativos de equilíbrio.

 O saldo das pessoas com classificação mais alta e com limite de crédito mais alto
pode ser aumentado, enquanto o saldo das pessoas com classificação mais baixa e
com limite de crédito mais baixo deve ser diminuído. (com base nesta análise)

11. O limite de crédito é fornecido como um valor consolidado para todos os cartões de
crédito que o titular do cartão possui. Execute uma regressão linear múltipla de Saldo (Y) no
Limite e Cartões como duas variáveis X. Informe os coeficientes. Discuta o efeito sobre o
saldo de (a) aumentar o limite de crédito no mesmo número de cartões e (b) aumentar o
número de cartões sem alterar o limite de crédito total.
Regressão linear múltipla:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.865188295
R Square 0.748550786
Adjusted R Square 0.74728404
Standard Error 231.1247525
Observations 400

ANOVA
df SS MS F Significance F
Regression 2 63132707.37 31566354 590.9238 9.8E-120
Residual 397 21207204.54 53418.65
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95%Upper 95%Lower 95.0%


Upper 95.0%
Intercept -369.0359554 36.16414657 -10.2045 7.23E-22 -440.133 -297.939 -440.133 -297.939
Credit Limit 0.171479037 0.005013136 34.20594 2E-120 0.161623 0.181335 0.161623 0.181335
Cards 26.03375427 8.438363509 3.085166 0.002177 9.444291 42.62322 9.444291 42.62322

O limite de crédito e o número de cartões são um preditor significativo do saldo de crédito e


ambos têm maior impacto no saldo.
Coeficiente de correlação = 0,865 e R-quadrado = 0,748
O aumento da unidade única ($) do limite de crédito com o mesmo cartão aumentará 0,17 do
saldo. (O limite de crédito é medido em uma escala mais ampla em comparação aos cartões e
tem 34,2 como erro padrão).
O aumento em um cartão aumentará 26,03 no saldo. Ou seja, o aumento no cartão aumenta o
saldo
12. Execute uma equação de regressão linear simples com Renda como X e Saldo como Y.
Relate os coeficientes. O coeficiente de renda é significativamente diferente de zero? O que
isso diz sobre o efeito da renda no equilíbrio?

Balance(y) y = 6.0484x + 246.51


R² = 0.215
2500

2000
SUMMARY OUTPUT
1500
Regression Statistics
Multiple R 0.463656457
1000
R Square 0.21497731
Adjusted R Square 0.213004891
500
Standard Error 407.8647195
Observations 400
0
0 50 100 150 200
ANOVA
df SS MS F Significance F
Regression 1 18131167.4 18131167 108.9917152 1.03089E-22
Residual 398 66208744.51 166353.6
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 246.5147506 33.19934735 7.425289 6.90344E-13 181.2467485 311.7827527 181.2467485 311.7827527
Income 6.048363409 0.579350163 10.43991 1.03089E-22 4.909394402 7.187332415 4.909394402 7.187332415

Renda Saldo(s)
Renda 1
Saldo(s) 0.46365645 1
7

Coeficiente de correlação para as duas variáveis =0,46


Com base na regressão o coeficiente de renda é 6,048.Sim; está bem longe de zero leva o
valor de 4,90 a 7,18. Adicionar uma unidade de renda aumentará o saldo em mais 6,04 e é
um preditor significativo. Com base na escala, vendo o t - stat, o erro padrão está a 10,4 de
distância de zero.

13. Com base na equação derivada da questão 12, qual é o saldo estimado para uma pessoa
com um rendimento de 100 mil dólares por ano?
Balance(y)
2500

2000

1500
f(x) = 6.04836340853157 x + 246.514750591403
R² = 0.214977310132406
1000

500

0
0 20 40 60 80 100 120 140 160 180 200

Com base na equação derivada Y = 6,0484 (X)+246,51


X = Renda
Y = 6,0484(100) + 246,51
Saldo estimado para uma pessoa com renda de US$ 100 mil por ano= $ 851,35.

14. Com base no conjunto de dados, explore a relação entre o saldo do cartão de crédito (Y) e
(a) Renda (b) Idade (c) Educação (c) Limite e (d) Classificação como variáveis X? Estime um
modelo de regressão linear múltipla e relate a significância estatística de cada uma dessas
variáveis.

Modelo de regressão múltipla:


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.936702578
R Square 0.87741172
Adjusted R Square
0.875856031
Standard Error
161.9917647
Observations 400

ANOVA
df SS MS F Significance F
Regression 5 74000827.17 14800165.43 564.0020686 4.5908E-177
Residual 394 10339084.74 26241.33183
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Lower 95.0%
Upper 95.0%
Intercept -473.2514026 55.10833546 -8.587655545 2.08837E-16 -581.5945666 -364.908 -581.595 -364.908
Income -7.608832003 0.381931562 -19.92197755 1.37077E-61 -8.359710677 -6.85795 -8.35971 -6.85795
Limit 0.07901642 0.044791005 1.764113581 0.078487737 -0.009042839 0.167076 -0.00904 0.167076
Rating 2.773843725 0.667079559 4.158190261 3.93909E-05 1.462363177 4.085324 1.462363 4.085324
Age -0.860030445 0.478700493 -1.796594023 0.073165937 -1.801157147 0.081096 -1.80116 0.081096
Education 1.967791521 2.605290902 0.755305874 0.450516748 -3.154218733 7.089802 -3.15422 7.089802

Income Limit Rating Age Education Balance


Income 1
Limit 0.792088 1
Rating 0.791378 0.99688 1
Age 0.175338 0.100888 0.103165 1
Education -0.02769 -0.02355 -0.03014 0.003619 1
Balance 0.463656 0.861697 0.863625 0.001835 -0.00806 1
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.93547739
R Square 0.875117948
Adjusted R Square 0.874488819
Standard Error 162.8813393
Observations 400

ANOVA
df SS MS F Significance F
Regression 2 73807370.62 36903685.31 1390.999823 4.5212E-180
Residual 397 10532541.29 26530.33071
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -534.8121502 21.60269845 -24.75672896 1.66359E-82 -577.2821357 -492.3421648 -577.282136 -492.3421648
Income -7.672124366 0.378462026 -20.2718472 3.1071E-63 -8.416164597 -6.928084134 -8.4161646 -6.928084134
Rating 3.949264832 0.086209035 45.81033566 1.4482E-160 3.77978154 4.118748125 3.77978154 4.118748125

Explicação:
 Com base na análise de regressão múltipla, fica claro que a renda e a classificação são
os dois preditores estatisticamente significativos com base no valor p.
 Todas essas variáveis, ou seja, renda, escolaridade, idade, limite e classificação, juntas
contribuíram para 87,7% da variação do saldo do cartão de crédito.
 Mas para compreender se estas variáveis também contribuíram e se apenas algumas
contribuíram para a variação no equilíbrio, são mantidas análises com valores P
aceitáveis.
 Portanto, mantendo os Xs com valor p baixo, ou seja, apenas com renda e
classificação , a análise de regressão foi feita novamente.
 Nesta regressão, a análise com essas duas variáveis mostrou variação de 87,5% no
saldo do cartão de crédito.
 Que é quase o mesmo valor de r quadrado do anterior.
 Com base nisso, fica muito claro que Renda e classificação são os dois preditores
significativos .
 Também se estuda os erros (resíduos) e o padrão.
 Ao focar nos resíduos de rendimento, verifica-se que há mais valores no lado negativo
e, especificamente, mais grupos de rendimentos mais baixos e a linha de ajuste
também não é linear.
 Os resíduos de classificação mostraram um lado positivo para classificações inferiores
e superiores, onde mostraram classificações negativas para outras classificações
típicas, onde a linha de ajuste das classificações é decente.
Observações Finais,
 A renda e a classificação são as duas variáveis importantes que contribuem
para a mudança no equilíbrio, enquanto o limite, a idade e a escolaridade não
são variáveis significativas para o equilíbrio.

Você também pode gostar