Você está na página 1de 8

Caso Prático 1 – Proposta de Resolução

1. Calcule e interprete as medidas de tendê ncia central (mé dia e media) e de


dispersã o (desvio-padrã o) da variá vel age.

Estatísticas
Idade
N Válido 4521
Média 41,17
Mediana 39,00
Erro Desvio 10,576

Interpretação: A média das idades dos clientes é de 41,17 anos. Metade dos
clientes tem 39 aos ou menos. O desvio médio das idades em relação à média
(41,17 anos) é de 10,58 anos.

2. Analise a existê ncia de outliers nas idades dos clientes atravé s da construçã o
de um boxplot.

Os outliers são os círculos acima do boxplot (por exemplo,o caso 3312


corresponde a um cliente com 87 anos).

MGP - MTI Ana Borges 2022/2023 1


3. Calcule e interprete as medidas de tendê ncia central (mé dia e media) e de
dispersã o (desvio-padrã o) da variá vel age, dividida pela variá vel y, para
entender se parecem existir diferenças nesses valores entre os clientes que
subscreveram ao depó sito a termo e os que nã o subscreveram.

MGP - MTI Ana Borges 2022/2023 2


4. Construa o grá fico circular para a variá vel y (aderiu ao depó sito a termo
versus nã o aderiu ao depó sito a termo) e a respetiva tabela de frequê ncias
relativas.

5. Construa o grá fico de barras para a variá vel marital e a respetiva tabela de
frequê ncias absolutas.

6. Construa o grá fico de barras empilhado cruzando a variá vel default e a


variá vel y. O que podemos concluir?

MGP - MTI Ana Borges 2022/2023 3


Podemos concluir que não parece existir relação/associação entre o crédito em dívida e
a Adesão ao Produto.

Como quantificar a Associação/relação entre o crédito em dívida (nominal) e adesão ao


produto (nominal)? R: Construindo a tabela de dupla entrada e calculando o coeficiente
V de Cramer, ou o Phi de Pearson (menu Analisar -> Estatística descritiva -> Tabela de
Referência Cruzada).

Como o valor de V de Cramer (e restantes) é de 0.001 (próximo de 0) a associação entre


o Crédito em dívida e a Adesão é muito fraca.

7. Construa o boxplot mú ltiplo da variá vel balance por y (subscreveu versus nã o
subscreveu). O que podemos concluir da observaçã o do grá fico construı́do?

Podemos concluir que existem inúmeros outlier severos (asteriscos, no gráfico) e


moderados, o que não permite uma análise clara dos boxplots. Mas é na categoria dos
clientes que não aderiram ao produto que se detetam mais e mais elevados outliers.

MGP - MTI Ana Borges 2022/2023 4


10. Teste, com um nı́vel de significâ ncia de 5%, se existem diferenças na idade mé dia
entre quem subscreveu e quem nã o subscreveu ao produto.

Teremos de realizar um teste t de comparação de médias, de amostras


independentes. Como o tamanho da amostra em cada grupo (aderiu e não aderiu) é
superior a 30, não é necessário testar a normalidade das variáveis.

𝐻! : 𝜇"#$%&%'( = 𝜇)ã+ "#$%&%'(

Versus

𝐻- : 𝜇"#$%&%'( ≠ 𝜇)ã+ "#$%&%'(

O Teste de Levene testa a hipótese nula (H0) de igualdade de variâncias. Como o


valor de prova (sig) <0.001 < 0,05, rejeita-se a H0 com 95% de confiança. Ou seja, as
variâncias são assumidas como diferentes. Logo, interpretamos a segunda linha do
teste t. Como o valor de prova (sig) = 0,013 < 0,05 rejeitamos H0 com 95% de
confiança. Ou seja, há evidência estatística que comprova a diferença das médias das
idades entre os que aderiram e os que não aderiram.
𝐻! : 𝜇"#$%&%'( = 𝜇)ã+ "#$%&%'(

A média das idades dos que aderiram é superior à média das idades dos clientes
que não aderiram.

MGP - MTI Ana Borges 2022/2023 5


11. Analise, graficamente, se existe uma relaçã o entre a idade e o balanço anual
mé dio do cliente. -> diagrama de dispersão

Pelo diagrama de dispersão, pela nuvem de pontos, não parece existir relação entre a idade
e o balanço anual médio (nuvem de pontos é aleatória, não apresenta um padrão). Para
quantificar a relação podemos calcular o coeficiente de correlação de Pearson (ou de
Spearman) (Analisar -> Correlacionar -> Bivariada)

O coeficiente de correlação de Pearson é bastante baixo (0,084), próximo de 0, ou seja,


a associação é fraca. No entanto é estatisticamente significativa ao nível de 1%.

MGP - MTI Ana Borges 2022/2023 6


12. Teste, com um nı́vel de significâ ncia de 5%, se existe uma relaçã o
estatisticamente significativa entre a idade e o balanço anual mé dio do cliente, e
quantifique a força da relaçã o.

Idade -> quantitativa

Balanço anual média -> quantitativa

O coeficiente de Pearson é de 0,084, bastante próximo de zero, tal como o coeficiente


de Spearman, o que significa que existe uma associação entre a idade e o balanço
anual dos clientes muito fraca. No entanto é estatisticamente significativa.

15. Analise, com um nı́vel de significâ ncia de 5%, a relaçã o entre o estado cı́vil e a
adesã o ao produto.

Estado civil -> variável nominal

Adesão ao produto -> variável nominal

MGP - MTI Ana Borges 2022/2023 7


Pela tabela de contingência não parece haver relação entre o estado civil e a adesão
ao produto uma vez que para todas as categorias, divorciado, casado e solteiro,
perto de 90% não aderiu ao produto.

O teste e qui-quadrado testa as hipóteses:

H0: não existe associação entre o estado civil e a adesão ao produto

Versus

H1: existe associação entre o estado civil e a adesão ao produto

Como o valor de prova (sig) <0,001 <0,05, rejeitamos a H0 do teste de qui-quadrado


com 95% de confiança. O que significa que a associação é estatisticamente
significativa. No entanto como o valor da estatística de V de Cramer é de 0,065
(muito próxima de zero) concluímos que essa associação, apesar de significativa, é
muito fraca.

MGP - MTI Ana Borges 2022/2023 8

Você também pode gostar