Você está na página 1de 11

Tratamento e Análise de Dados

Trabalho Prático

Elsa Georgina Ramos Silva N.º 26331

Fátima Cristina Dias da Silva N.º 26449


1. Caraterize de forma mais exaustiva e adequada a amostra em função das variáveis: sexo, idade,
estado civil, escolaridade, saúde mental, saúde física, bem-estar geral, suporte social e otimismo.

• A variável idade é uma variável quantitativa contínua, sendo que a amostra é constituída por
158 indivíduos, não existindo valores inválidos, cuja idade média é de 24.96 anos. A mediana é de 22
anos, o que significa que 50% dos indivíduos tem idade inferior a 22 anos e os restantes 50% tem
idade superior a 22 anos. Existem múltiplas modas, sendo que o menor valor que mais
frequentemente se repete é 21 anos.
• A variável suporte social é uma variável quantitativa contínua, sendo que a amostra é constituída
por 158 indivíduos, não existindo valores inválidos, cuja média de suporte social é de 70.14. A
mediana é de 72.50, o que significa que 50% dos indivíduos tem suporte social inferior a 95 e os
restantes tem superior. O valor mais frequente de suporte social é de 95.
• A variável saúde mental é uma variável quantitativa contínua, sendo que a amostra é constituída
por 158 indivíduos, não existindo valores inválidos, cuja média de saúde mental é de 58.58. A
mediana é de 59, o que significa que 50% dos indivíduos tem saúde mental de 59 e os restantes 50%
tem superior. O valor mais frequente de saúde mental é de 45.
• A variável bem-estar geral é uma variável quantitativa contínua, sendo que a amostra é
constituída por 158 indivíduos, não existindo valores inválidos, cujo nível médio de bem-estar geral
é de 38.61. A mediana é de 39, o que significa que 50% dos indivíduos tem saúde mental de 39 e os
restantes 50% tem superior. O nível mais frequente de bem-estar geral é de 36.
• A variável saúde física é uma variável quantitativa contínua, sendo que a amostra é constituída
por 158 indivíduos, não existindo valores inválidos, cujo nível médio saúde física é de 76.62. A
mediana é de 82, o que significa que 50% dos indivíduos tem um nível médio de saúde físico de 82 e
os restantes 50% tem superior. O nível médio mais frequente de saúde física é 87.
• A variável otimismo uma variável quantitativa contínua, sendo que a amostra é constituída por
158 indivíduos, não existindo valores inválidos, cujo nível médio de otimismo é de 19.64. A mediana
é de 20, o que significa que 50% dos indivíduos tem um nível médio de otimismo de 19.64 e os
restantes 50% tem superior. O nível médio mais frequente de otimismo é de 23.
• A variável da idade é uma variável quantitativa contínua, sendo que a amostra é constituída por
158 indivíduos, não existindo valores inválidos, sendo que 65.8% da amostra são elementos do sexo
feminino e 34.2% são elementos do sexo masculino.
• A variável do estado civil é uma variável qualitativa nominal, sendo que a amostra é constituída
por 13.3% de indivíduos casados ou em união de fato, 0.6% dos indivíduos namoram ou vivem juntos,
86.1 de indivíduos solteiros.
• A variável da escolaridade é uma variável qualitativa ordinal, sendo que a amostra é constituída
por 8.9% dos indivíduos com o doutoramento, 0.6% de indivíduos com o 2.º ciclo, 1.3% de indivíduos
com o 3.º ciclo, 1.3% dos indivíduos com o ensino pós-secundário (cursos profissionais e
tecnológicos), 74.7% dos indivíduos com ensino pós-secundário e ensino universitário, 13.3% de
ensino secundário.

2. Verifique ao nível de significância de 5% se pode afirmar que a média de idade dos respondentes é
significativamente diferente de 30 anos.

2.1. Teste de normalidade:

H0: x ~ n (µ, σ)

H1: x ≠ n (µ, σ)

→ Como n= 158 > 50, irá ser utilizado o teste de Kolmogorov – Smirnov:
Conclusão teste de normalidade: Como p = 0.001 < α= 0.05, então rejeita-se H0, logo a amostra não
segue uma distribuição normal pelo que deveria ser utilizado um teste não paramétrico.

No entanto, e partindo do pressuposto de aplicação de um teste paramétrico, utilizou-se o teste T


para 1 amostra.

2.2. Teste T:

H0: 𝝁 = 𝟑𝟎

H1: ≠ 30

Conclusão do teste T: Como p = 0,001 < α=0,05, então rejeita-se H0, logo na amostra a média de
idades é significativamente diferente de 30 anos.

3. O SNS defende que para a classe mais jovem (idade <=30 anos) o otimismo difere em função do
género. Comente a afirmação usando um nível de significância de 1%.

3.1. Teste de normalidade:


HF0: x ~ n (µ, σ)

HF1: x ≠ n (µ, σ)

→ Como n= 89 > 50, irá ser utilizado o teste de Kolmogorov – Smirnov.

Conclusão teste de normalidade para o género feminino: Como p = 0,174 > α=0,01, então não se
rejeita-se H0, logo a amostra segue uma distribuição normal.

HM0: x ~ n (µ, σ)

HM1: x ≠ n (µ, σ)

→ Como n= 47 > 50, irá ser utilizado o teste de Shapiro-Wilk.

Conclusão teste de normalidade para o género masculino: Como p = 0,042 > α= 0,01, então não se
rejeita-se H0, logo a amostra segue uma distribuição normal.

Conclusão dos testes de normalidade: como ambas as amostras seguem uma distribuição normal,
então irá utilizar-se um teste paramétrico: Teste T para duas amostras independentes.

3.2. Teste de homogeneidade das variâncias:

H0: o2m = o2f

H1: o2m ≠ o2f

Conclusão do teste de homogeneidade das variâncias: como p= 0,457 > α =0,01, então não se rejeita
H0, logo as variâncias são homogêneas.
3.3. Teste T para duas amostras independentes

H0: µm ≠ µf (o otimismo difere em função do género)

H1: µm = µf (o otimismo não difere em função do género)

Conclusão do teste T para duas amostras independentes: como p=0,056 > α =0,01, então não se
rejeita H0, logo conclui-se que o otimismo difere em função do género.

4. Estudos mostram que o bem-estar geral melhora com a prática de exercício físico. Com um nível
de significância de 5% justifique a veracidade dos mesmos.

4.1. Teste de normalidade:

H0: x ~ n (µ, σ)

H1: x ≠ n (µ, σ)

Mais de 3 vezes por semana: como n < 50, então utiliza-se o Shapiro-Wilk.

Conclusão do teste de normalidade para + 3 vezes por semana: como p = 0,439 > α=0.05 logo
não se rejeito H0, segue uma distribuição normal.

Menos de 3 vezes por semana: como n = 72 > 50, então utiliza-se o kolmogorov - Smirnov

Conclusão do Teste de normalidade para - 3 vezes por semana: como p = 0.200 > α=0.05 logo
não se rejeito H0 , logo segue uma distribuição normal.
Nunca: como n = 39 < 50, então utiliza-se o Shapiro-Wilk

Conclusão do Teste de normalidade para nunca: como p = 0.424 > α=0.05 logo não se rejeita
H0 , logo segue uma distribuição normal.

Conclusão dos testes de normalidade: todos seguem uma distribuição normal, logo utiliza-se
um teste paramétrico. Para 3 variáveis independentes utiliza-se a ANOVA.

4.2. ANOVA

4.2.2. Teste da homogeneidade

Conclusão do teste da homogeneidade: Como p = 0,332 > α=0.05 logo não se rejeita H0, o que
significa as variâncias são iguais.

4.2.3. Igualdade das médias:

H0 = µ1 = µ2 = µ3

H1 = Ǝi,j = µ1 ≠ µj ( i ≠ j)

Conclusão sobre o teste de igualdade de médias: Como p = 0, 005 < α=0.05 logo rejeita-se H0,
logo há diferenças em pelo menos um grupo.
H0: µ1 = µ2
H1: µ1 ≠ µ2

Como p=0,88 > α=0.05, logo não se rejeita H0 pelo que não existem diferenças significativas entre
os dois grupos.

H0: µ1 = µ3
H1: µ1 ≠ µ3

Como p=0,035 < α=0.05, logo rejeita-se H0 pelo que existem diferenças significativas entre os dois
grupos.

H0: µ2 = µ3
H1: µ2 ≠ µ3

Como p=0,88 > α=0.05, logo não se rejeita H0 pelo que não existem diferenças significativas entre
os dois grupos.

Conclusão Teste ANOVA: o bem-estar geral varia com a prática de exercício físico.
5. Pretende-se estimar um modelo de regressão linera de forma a prever a saúde mental baseada
na idade, género, suporte social e no impacto do covid. Com um nível de significância de 5%
teste o modelo e avalie os pressupostos do mesmo.

5.1. Linearidade:
Conclusão da Linearidade: através da análise dos gráficos não é claro que exista uma relação
linear entre as variáveis testadas e a saúde mental.

Coeficiente de determinação: 15,6% da variabilidade da saúde mental é explicada pelo impacto


do isolamento do covid e do sexo, sendo que 9% corresponde ao impacto covid e os restantes
6.6% corresponde ao sexo.

Erros: Como a estatística de Durbin-Watson = 1.635 ~ 2, então os erros não estão


correlacionados.
Multicolinearidade: Dado que o valor de VIF = 1,000 < 5 então não existe multicolinariedade,
ou seja, não existe correlação forte entre as variáveis independentes.

Equação da reta estimada:

^y = b0 + b1x1 + b2x2

^y = 64,003 + -3.468x1 + 14,180x2

Conclusão relativamente ao impacto do covid sobre a saúde mental: o aumento de uma


unidade no impacto do isolamento faz diminuir em média a saúde mental em -3.468 unidades,
mantendo as restantes variáveis constantes.

Observações: Tivemos bastante dificuldade na resposta 5, inclusive não conseguimos terminar


o exercício.

Você também pode gostar